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随 着 现代 信息 技术 、 物 联网 及 大 数据 的 快速 发 展 ,数据 驱动 的 设备 健康 预测 、 
维护 及 运行 状态 ,对 企业 生产 经 营 和 经 济 效 益 的 影响 也 日 益 显 著 。 设 备 的 可 靠 性 
和 有 效 维护 保障 了 企业 正常 运行 ,是 企业 生存 的 必要 条 件 。 因 此 ,高 效 的 设备 维护 
在 企业 生产 经 营 中 的 作用 和 地 位 日 益 突出 ,是 企业 降低 生产 成 本 和 保证 生产 效率 
的 基础 。 半 个 多 世纪 以 来 ,不 少 学 者 针对 设备 的 维护 进行 了 许多 研究 ,但 是 ,设备 
健康 预测 对 维护 策略 影响 方面 的 研究 较 少 。 

本 书 立 足 于 过 去 几 十 年 国内 外 的 设备 健康 预测 与 维护 相关 的 研究 基础 ,利用 
数据 分 析 了 设备 的 运行 状态 ,描述 了 设备 的 衰退 趋势 ,实现 了 有 效 的 在 线 健康 预 
测 ,为 设备 的 集成 动态 维护 提供 了 决策 依据 。 首 先 ,本 书 应 用 隐 式 半 马 尔 可 夫 模型 
(Hidden semi-Markov-Model, HSMM) 对 设备 在 线 运行 过 程 中 的 健康 进行 识别 与 
预测 ,提出 了 单 监测 信息 在 线 健康 预测 方法 。 其 次 ,基于 单 监 测 信 息 在 线 健康 预 
测 ,探讨 了 多 监测 信息 的 在 线 健康 预测 方法 。 再 次 ,基于 设备 在 线 健康 预测 和 衰退 
性 能 的 预测 ,建立 了 设备 的 集成 动态 维护 模型 ,从 而 有 助 于 设备 维护 领域 的 发 展 。 
最 后 ,基于 集成 维护 模型 ,描述 了 多 部 件 设备 维护 调度 的 优化 。 

第 1 章 是 绪论 部 分 ,这 部 分 主要 益 述 本 书 选 题 的 背景 、 研 究 的 技术 路 线 ,并 且 
讨论 了 研究 主要 创新 点 和 所 期 望 达到 的 研究 目标 。 

第 2 章 是 相关 概念 部 分 ,描述 了 设备 健康 管理 的 发 展 历程 ,分 析 和 探讨 了 已 有 
设备 健康 预测 .设备 维护 及 调度 的 相关 研究 ,包括 对 已 有 的 研究 进行 回顾 ,评论 已 
有 方法 的 不 足 , 确 定 需 要 进一步 研究 的 方向 。 同 时 ,给 出 了 退化 隐 半 马尔 可 夫 模 型 
的 概念 。 

第 3 章 研 究 了 单 监 测 信 息 的 在 线 健康 预测 问题 。 基 于 HSMM 和 序列 蒙特 卡 
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i (Sequential Monte Carlo,SMC) 的 联合 优化 ,建立 了 一 套 完整 的 HSMM 和 SMC 
联合 优化 的 在 线 健康 预测 模型 ,提出 了 一 种 联合 多 步 向 前 健康 识别 算法 ,用 于 在 线 
识别 设备 的 健康 状态 ,并 且 ,建立 了 在 线 剩 余 寿命 预测 模型 。 目 前 ,已 有 的 单一 方 
法 、 模 型 .算法 很 难 满足 设备 的 在 线 健康 预测 ,本 研究 提出 的 联合 模型 ,基于 
HSMM 丰富 的 数学 结构 和 SMC 的 在 线 特征 ,利用 设备 的 健康 预测 对 其 性 能 状态 
进行 量化 ,进而 描述 了 设备 的 实际 运行 状况 ,为 设备 在 线 健康 管理 提供 理论 支持 和 
决策 依据 。 

第 4 章 在 单 监测 信息 健康 预测 的 基础 上 ,建立 了 多 监测 信息 的 在 线 健康 预测 
模型 。 为 了 更 好 地 提高 在 线 健康 预测 的 精确 度 , 基 于 单 监测 信息 在 线 健康 预测 
方法 的 思想 ,本 书 提出 了 多 监测 信息 的 在 线 健康 预测 方法 。 为 了 处 理 多 监测 信 
息 和 降低 模型 的 计算 复杂 性 ,对 HSMM 的 基本 算法 进行 了 修正 ,计算 复杂 性 从 
OLCMD--M') TBE ARB] OL(D 二 Mr)T]。 建 立 了 自 适应 隐 式 半 马 尔 可 夫 模 型 
(Adaptive Hidden semi-Markov Model, AHSMM) ,来 处 理 多 监测 信息 的 在 线 健康 
预测 问题 ,应 用 最 大 似 然 线性 回归 训练 对 输出 概率 分 布 和 驻 留 概率 分 布 进行 自 适 
应 训练 ,处 理 多 监测 信息 之 间 的 差异 性 。 结 合 修正 的 HSMM 进行 有 效 的 多 监测 
信息 在 线 健康 预测 。 在 此 基础 上 ,本 书 提出 了 多 监测 信息 的 在 线 剩余 寿命 预测 方 
法 。 同 时 ,探讨 了 设备 的 在 线 健 康 管 理 , 得 到 基于 多 监测 信息 的 预测 模型 ,并 比较 
了 两 种 健康 预测 方式 的 异同 ,给 出 了 多 源 信息 融合 健康 管理 的 启示 与 思考 。 

第 5 章 在 设备 健康 预测 基础 上 ,建立 了 基于 在 线 健康 预测 的 集成 动态 维护 模 
型 。 不 同 于 传统 的 维护 方式 ,集成 维护 将 设备 的 退化 信息 和 老化 信息 引入 维护 模 
型 中 ,结合 设备 的 诊断 信息 和 预测 信息 ,以 总 的 维护 成 本 (故障 成 本 、 维 护 成 本 和 资 
源 成 本 ) 和 总 维护 时 间 为 目标 ,建立 了 两 层 集成 动态 维护 模型 。 在 传统 的 维护 模型 
中 ,设备 的 维护 资源 只 考虑 了 备件 的 约束 条 件 ,而 本 书 同时 考虑 了 备件 和 维修 人 员 
的 双 约 束 条 件 。 另 外 ,针对 小 修 和 大 修 的 维护 方式 ,引入 了 维护 风险 因素 ,将 维护 
风险 因子 集成 到 维护 模型 ,提出 了 设备 集成 维护 管理 的 建议 和 策略 。 

第 6 章 在 系统 的 维护 策略 的 基础 上 ,建立 了 基于 集成 维护 模型 的 维护 调度 优 
化 模型 ,针对 多 部 件 设备 的 特点 ,建立 了 多 部 件 设备 的 维护 拓展 模型 。 多 部 件 设备 
的 维护 决策 包括 性 能 衰退 .维护 方式 和 维护 费用 三 部 分 。 在 性 能 衰退 方面 ,通过 在 
线 诊断 信息 和 预测 信息 得 到 设备 故障 率 的 变化 趋势 ,用 威 布尔 分 布 模拟 设备 的 衰 
退 过 程 ;在 维护 方式 方面 ,定义 小 修 、 大 修 和 更 换 三 种 维护 方式 ,分 别 描述 了 三 种 维 
护 方式 对 设备 故障 率 的 影响 ;在 维护 费用 方面 ,考虑 了 故障 成 本 、 维 护 成 本 资源 成 
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本 和 停机 成 本 四 部 分 ,根据 每 次 维护 活动 的 费用 模型 ,建立 了 多 阶段 的 总 费用 率 模 
型 。 本 研究 为 多 部 件 设备 维护 管理 黄 定 了 理论 基础 和 决策 依据 。 

第 7 章 为 研究 工作 的 总 结 , 给 出 了 研究 的 结论 ,并 讨论 了 多 源 状 态 信息 下 的 设 
备 在 线 健康 预测 ,集成 维护 与 设备 衰退 问题 未 来 可 能 的 研究 方向 。 

本 书 的 7 章 内 容 相互 之 间 联 系 紧密 ,形成 了 一 个 数据 驱动 的 系统 性 设备 维护 
决策 框架 。 基 于 单 监 测 信息 在 线 健康 预测 思想 ,提出 了 多 监测 信息 的 健康 预测 方 
法 ;基于 在 线 健康 预测 ,提出 了 考虑 设备 衰退 性 能 和 维护 资源 的 集成 动态 维护 模 
型 。 本 书 所 做 的 研究 内 容 有 助 于 提高 企业 的 维护 水 平和 设备 可 靠 性 .降低 维护 成 
本 提高 设备 利用 率 , 最 终 提 高 企业 的 竞争 力 。 同 时 ,拓展 了 制造 系统 的 维护 管理 
领域 ,为 制造 企业 维护 策略 的 制定 提供 决策 支持 和 科学 有 效 的 指导 。 

本 书 得 到 了 国家 自然 科学 基金 重点 项 目 (项 目 编号 :71632008) 、 国 家 自然 科学 
基金 项 目 (项 目 编号 :71371123) ,教育 部 人 文 社会 科学 研究 青年 基金 项 目 ( 项 目 编 
号 :15YJCZH096) 的 资助 ,笔者 深 表 谢意 。 由 于 笔者 的 水 平 有 限 , 书 中 难免 有 不 妥 
之 处 , 敬 请 读者 不 音 批评 指正 。 
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1.1 研究 背景 和 意义 


当前 , 随 着 经 济 与 科学 技术 的 飞速 发 展 ,对 设备 的 高 可 靠 性 要 求 日 益 增 加 , 企 
业 的 生产 需求 也 急剧 增加 ,因而 也 提高 了 企业 对 生产 设备 管理 的 要 求 。 企 业 在 满 
足 其 最 高 产能 的 前 提 下 ,要 求实 现 生 产 管理 的 高 有 效 性 、 可 靠 性 , 低 生产 风险 性 及 
高 生产 安全 性 。 在 企业 的 生产 管理 中 ,设备 管理 是 其 一 个 重要 的 组 成 部 分 ,设备 管 
理 的 水 平 及 可 靠 性 会 影响 企业 的 持续 发 展 . 生 产 水 平 及 其 生产 效率 等 。 设 备 故障 
的 意外 发 生 , 通 常会 增加 企业 的 设备 维护 支出 ,因为 在 绝 大 多 数 正常 情况 下 ,设备 
发 生 故 障 导致 的 事后 维修 支出 相 较 日 常设 备 的 预防 性 维护 支出 而 言 ,要 高 出 许多 。 
除去 维修 费用 ,设备 故障 造成 的 计划 外 停机 也 会 造成 生产 及 与 生产 相关 的 一 系列 
损失 ,使 企业 蒙受 巨大 的 损失 。 据 调查 ,未 纳入 计划 的 一 天 停工 ,其 经 济 损失 可 高 
3k 10 万 一 20 万 欧元 上 。 

设备 是 企业 进行 正常 生产 运转 的 技术 基础 ,如 果 设 备 在 生产 使 用 过 程 中 ,未 进 
行 有 效 的 维护 ,就 可 能 会 失效 或 者 发 生 故障 ,对 企业 来 说 ,这 不 仅 会 增加 相应 的 设 
备 维护 成 本 ,影响 企业 的 生产 效率 ,还 会 降低 生产 线 上 的 在 制品 质量 ,从 而 造成 企 
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业 的 巨大 损失 。 对 企业 来 说 ,由 于 低 效 或 者 无 效 的 维护 ,维护 费用 的 三 分 之 一 或 者 
二 分 之 一 都 浪费 了 中 。 因 而 ,通过 对 设备 进行 合理 有 效 的 维护 来 降低 故障 发 生 率 ， 
已 成 为 企业 降低 生产 成 本 、 提 高 生产 效率 和 市 场 竞 争 力 的 重要 手段 之 一 。 

工业 设备 和 生产 系统 操作 的 可 靠 性 对 生产 型 企业 的 盘 利 能 力 和 竞争 能 力 都 有 
重要 影响 ,这 使 企业 对 工业 生产 过 程 和 生产 设备 维护 策略 重要 性 的 关注 日 益 增 加 。 
维护 ,是 指 为 了 保持 或 恢复 设备 系统 处 于 正常 执行 预定 功能 状态 ,而 进行 的 所 有 相 
关 技 术 和 管理 活动 。 维 护 最 基本 的 作用 是 延长 设备 的 使 用 寿命 ,避免 事故 的 发 生 
和 技术 性 灾难 ,为 生产 节约 .节省 原材料 和 动力 资源 从 而 减少 生产 费用 ,提高 生产 
利润 和 投资 回报 率 中 。 对 企业 生产 管理 而 言 ,制定 一 个 行 之 有 效 的 维护 管理 系统 
是 非常 必要 的 。 它 可 以 将 维护 成 本 维持 在 一 个 较 低 水 平 , 同 时 使 所 有 的 设备 都 保 
持 高 效率 的 运作 。 近 年 来 , 随 着 设备 维护 研究 的 不 断 深入 ,以 及 实践 的 实施 验证 ， 
企业 管理 人 员 和 研究 人 员 对 维护 管理 领域 的 认 知 也 在 逐步 提高 ,新 的 维护 理念 与 
方法 、 新 的 应 用 领域 都 不 断 出 现 外 ,主要 表现 如 下 。 

(1) 第 三 方 运营 维护 的 出 现 , 外 部 社会 化 维护 资源 的 介入 使 工业 制造 型 企业 不 
再 依赖 企业 内 部 提供 的 维护 资源 。 

(2) 维 护 不 再 是 一 种 单纯 消耗 企业 资源 的 活动 ,而 被 看 作 是 创造 企业 利润 的 来 
源 。 优 化 的 维修 策略 可 直接 作用 于 生产 率 的 提高 上 ,从 而 为 企业 创造 更 多 利润 。 

(3) 设 备 维护 管理 不 再 只 关注 设备 故障 本 身 ,还 将 与 设备 故障 相关 的 许多 因 
素 , 如 维修 后 设备 状态 、 维 修成 本 停工 损失 等 ,都 纳入 维护 决策 的 考虑 和 优化 的 过 
程 中 。 

(4) 设 备 维护 管理 不 再 被 视 为 孤立 的 管理 活动 单独 进行 , 它 开始 与 企业 的 其 他 
管理 职能 ,如 库存 管理 .生产 计划 制订 等 相 结合 ,共同 拟订 一 个 集成 的 生产 维护 采 
购 计 划 ,以 取得 更 大 的 效益 。 

设备 的 主要 前 期 维护 方式 包括 两 大 类 :出 现 故障 后 采取 的 恢复 性 维护 方式 和 
保持 设备 良好 运转 状态 的 预防 性 维护 方式 。 

其 一 ,事后 维护 。 表 示 设 备 出 现 故障 后 对 其 采取 的 维护 方式 ,也 就 是 说 ,设备 
坏 了 才 进 行 维修 ,如 果 设备 没有 故障 ,就 不 进行 维修 。 事 后 维护 是 一 种 无 计划 性 的 
被 动 维修 方式 。 

其 二 ,预防 维护 。 表 示 设 备 在 生产 中 以 预防 故障 为 主要 目的 ,对 设备 进行 检查 
和 检测 ,防止 设备 故障 发 生 或 者 发 现 设备 的 故障 征兆 ,使 设备 保持 最 初 的 功能 状 
态 ,在 故障 发 生 之 前 所 进行 的 各 种 维护 、 维 修 活 动 。 
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设备 维护 管理 在 经 历 了 事后 维护 预防 维 护 阶段 后 ,出 现 了 一 种 新 的 设备 维护 
方式 , 即 状 态 维护 (condition based maintenance,CBM)。 在 状态 维护 过 程 中 ,监测 
设备 的 工作 状态 及 环境 ,通过 传感器 获得 设备 的 实时 状态 信息 ,利用 先进 的 数据 处 
理 技术 对 监测 到 的 设备 信息 进行 分 析 , 从 而 获得 当前 的 健康 诊断 状况 ,并 通过 一 系 
列 的 设备 诊断 预测 方法 来 预测 设备 的 有 效 寿命 ,合理 地 确定 设备 的 维护 计划 及 维 
护 时 间 。 有 效 实施 状态 维护 主要 包括 两 个 方面 :诊断 和 预测 。 诊 断 主要 表示 设备 
出 现 运转 异常 时 ,对 设备 的 故障 进行 诊断 判断 及 处 理 。 预 测 主 要 表示 设备 出 现 故 
障 前 ,对 设备 的 状态 进行 预测 。 随 着 生产 技术 的 不 断 发 展 , 机 械 设备 复杂 性 在 提高 
的 同时 ,也 增加 了 企业 生产 系统 的 复杂 性 ,因此 ,设备 的 诊断 和 预测 会 面临 更 大 
困难 。 

在 新 的 设备 维护 方式 中 ,设备 的 健康 预测 作为 新 兴 的 研究 内 容 ,被 引入 设备 的 
维护 研究 领域 ,并 且 成 为 当前 研究 的 一 个 热点 问题 。 随 后 不 久 , 设 备 的 健康 预测 获 
得 了 攻 勃 的 发 展 ,但 是 ,在 发 展 过 程 中 出 现 的 一 些 预 测 方法 在 使 用 过 程 中 缺乏 通用 
性 ,仅仅 局 限于 某 些 特定 的 领域 ,如 航空 领域 .汽车 领域 .国防 领域 等 加 ,并 且 , 已 有 
的 许多 预测 模型 是 建立 在 对 设备 的 监测 信息 进行 技术 处 理 与 分 析 的 基础 上 的 。 在 
维护 策略 的 优化 研究 中 ,对 传感器 检测 信息 的 分 析 建 模 有 利于 设备 健康 预测 方法 
的 发 展 , 促 使 设备 在 诊断 当前 健康 状态 时 ,还 能 够 有 效 地 预测 未 来 状态 的 发 展 趋 
势 。 然 而 ,对 于 目前 的 预测 模型 ,大 多 数 都 是 离线 对 设备 进行 健康 预测 ,为 了 使 预 
测 的 设备 状态 与 设备 的 实际 状态 更 加 吻合 ,进行 了 单 监测 信息 的 设备 在 线 健康 预 
测 , 在 此 基础 上 ,进一步 研究 了 多 监测 信息 的 在 线 健康 预测 。 在 设备 的 维护 过 程 
中 ,高 准确 性 和 可 靠 性 的 设备 健康 预测 结果 是 保证 设备 维护 效果 的 重要 因素 ,并 影 
响 生 产 安全 性 的 提升 .生产 任 务 的 合理 制定 \ 设 备 维护 策略 的 有 效 实 施 、 设 备 维 护 
成 本 的 降低 ,以 及 设备 生产 停工 时 间 的 减少 等 方面 。 虽然 有 效 的 在 线 健康 预测 是 
很 难 的 研究 内 容 , 但 是 ,设备 的 在 线 健康 预测 技术 及 方法 模型 仍 是 研究 的 热点 领 
域 。 进 行 设备 健康 预测 的 意义 主要 体现 在 以 下 方面 。 

(1) 从 经 济 角度 考虑 ,准确 有 效 的 在 线 健康 预测 可 以 为 减少 设备 停机 时 间 、 提 
高 设备 的 利用 率 、 保 证 设备 的 持续 使 用 提供 基础 ,可 以 保障 企业 在 规定 的 时 间 完 成 
预期 的 工作 任务 ,从 而 提高 客户 的 满意 度 和 企业 的 效益 。 同 时 ,后 续 基 于 在 线 健康 
预测 的 设备 维护 ,也 为 企业 带 来 了 合理 有 效 的 维护 决策 。 

(2) 从 安全 角度 考虑 ,设备 的 故障 或 者 突 发 故障 可 能 会 带 来 难以 估算 的 安全 隐 
患 ,比如 航天 设备 .核电 设备 .矿山 设备 等 ,一 旦 发 生 故 障 , 会 造成 人 员 伤 亡 和 企业 
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的 经 济 损失 。 如 果 进 行 合理 ` 有 效 、 精 确 的 在 线 健康 预测 ,就 可 以 在 设备 恶化 或 者 
衰退 前 ,对 其 进行 合理 的 维护 决策 ,从 而 减 小 设备 的 安全 隐患 。 

(3) 从 生产 角度 考虑, 合理 有 效 的 在 线 健康 预测 可 以 为 企业 的 维护 决策 提供 依 
据 , 可 以 实现 用 最 少 的 备件 库存 满足 最 大 的 维护 操作 ,进而 降低 企业 的 备件 库存 
费用 





在 对 设备 健康 预测 的 相关 模型 方法 进行 总 结 归纳 的 基础 上 ,本 书 拓展 和 改进 
了 健康 预测 方法 ,提出 了 单 监测 信息 和 多 监测 信息 的 在 线 健康 预测 方法 。 基 于 设 
备 监测 信息 的 健康 预测 ,反映 了 设备 健康 预测 模型 的 个 体 特征 ;同时 ,由 于 设备 的 
监测 信号 具有 实时 性 ,提出 的 在 线 健康 预测 模型 不 断 更 新 ,因而 ,实时 追踪 设备 当 
前 最 新 的 健康 状态 可 以 反映 设备 健康 预测 模型 的 更 新 特征 ,是 十 分 有 意义 的 研究 。 

在 现实 中 ,维护 不 仅 局 限于 制造 业 领 域 ,也 在 其 他 行业 也 得 到 了 极 大 的 关注 与 
应 用 (如 服务 行业 ) ,如 医院 里 大 型 贵重 医疗 器 械 的 维护 5 ,公共 设施 如 桥梁 道路 的 
维护 "9 ,物流 行业 的 车 辆 更 新 "等 对 于 各 个 行业 不 同 的 维护 对 象 ,最 终 的 维护 目 
标 都 是 降低 其 成 本 ,提高 设备 的 利用 率 和 竞争 力 。 目 前 ,针对 设备 的 维护 问题 , 设 
备 的 诊断 信息 发 挥 着 重要 的 作用 , 随 着 对 维护 要 求 的 提高 ,在 设备 的 维护 过 程 中 ， 
需要 同时 考虑 设备 的 预测 信息 。 在 本 书 中 ,基于 设备 的 在 线 健康 预测 ,可 获得 设备 
的 诊断 信息 和 预测 信息 ,对 设备 进行 全 面 维护 ,可 以 满足 企业 的 多 样 化 需求 ,消除 
企业 提高 生产 率 的 “瓶颈 ”问题 。 对 基于 状态 监测 信息 的 预测 与 系统 性 设备 维护 管 
理 从 理论 和 方法 方面 进行 研究 ,并 在 此 基础 上 实现 预测 性 维护 ,可 以 获得 巨大 的 经 
济 效益 。 





1.2 研究 范围 与 对 象 


优化 的 维护 策略 可 以 分 为 数据 采集 、 信 号 处 理 和 维护 决策 三 个 部 分 。 数 据 采 
集 表 示 数 据 收集 和 存储 目标 设备 有 用 数据 的 过 程 ; 信 号 处 理 表示 处 理 和 分 析 数 据 
以 更 好 获得 设备 健康 状态 的 过 程 ; 维 护 决 策 表 示 基 于 设备 健康 预测 ,制定 有 效 维护 
策略 的 过 程 。 维 护 决 策 包 含 两 个 基础 内 容 : 设 备 健康 诊断 与 设备 健康 预测 。 本 书 
主要 研究 了 基于 设备 诊断 和 预测 信息 的 单 监测 信息 与 多 监测 信息 的 在 线 健康 预测 
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模型 ,进而 发 展 到 设备 的 集成 动态 维护 与 设备 的 维护 调度 研究 。 因 此 ,数据 收集 的 
方法 如 传感器 选 型 ,传感器 布置 ,信号 处 理 方法 如 信号 降 品 等 都 不 是 本 书 所 要 研究 
的 内 容 。 

本 书 是 以 液压 泵 为 研究 对 象 ,来 阐述 整个 文章 的 内 容 的 。 液 压 泵 是 液压 系统 
的 动力 元 件 , 其 作用 是 将 原 动 机 的 机 械 能 转换 成 液体 的 压力 能 ,液压 系统 中 的 油泵 
向 整个 液压 系统 提供 动力 。 液 压 泵 是 靠 密 封 容积 的 变化 来 实现 吸油 和 压 油 的 , 故 
可 称 为 容积 泵 。 其 工作 过 程 就 是 吸油 和 压 油 过 程 。 液 压 泵 组 成 的 系统 主要 有 以 下 
五 部 分 :四 能 源 装置 , 它 是 供给 液压 系统 压力 油 , 把 机 械 能 转换 成 液压 能 的 装置 。 
加 执行 装置 , 它 是 把 液压 能 转换 成 机 械 能 的 装置 。 回 控制 调节 装置 , 它 是 对 系统 中 
的 压力 流量 或 流动 方向 进行 控制 或 调节 的 装置 。 轩 辅助 装置 ,上 述 三 部 分 之 外 的 
其 他 装置 ,如 油箱 、 滤 油 器 ,油管 等 。 它 们 对 保障 系统 正常 工作 是 必 不 可 少 的 。 
@ 工 作 介 质 传 递 能 量 的 流体 , 即 液压 油 等 。 液 压 泵 一 般 包 括 以 下 部 件 : 饶 体 、 偏 心 
轮 , 柱 塞 、 吸 油 阀 . 排 油 阔 ,传动 轴 、 中 心 弹簧 , 斜 盘 。 

首先 ,基于 液压 泵 的 监测 信息 ,提出 了 液压 泵 单 监测 信息 的 在 线 健康 预测 模 
型 ,在 此 基础 上 ,提出 了 液压 泵 的 多 监测 信息 的 在 线 健康 预测 。 其 次 ,基于 在 线 健 
康 预测 模型 ,提出 了 液压 泵 整体 的 集成 动态 维护 模型 。 液 压 泵 这 一 类 设备 ,都 是 由 
多 部 件 所 组 成 的 ,因此 ,在 液压 泵 整体 维护 模型 的 基础 上 ,进一步 考虑 并 分 析 该 类 
设备 的 维护 调度 问题 。 


1.3 研究 目的 与 创新 点 


目前 ,由 于 工业 界 对 预防 性 维护 技术 的 需求 ,故障 诊断 领域 的 研究 重点 已 逐步 
转向 状态 监测 、 预 测 性 维修 和 故障 早期 诊断 。 预 测 主要 采用 自动 化 的 模型 探测 、 诊 
断 和 分 析 物 理 系统 性 能 的 退化 ,并 计算 在 不 可 接受 的 性 能 退化 发 生前 ,设备 处 于 可 
接受 工作 状态 内 的 有 效 剩余 寿命 。 退 化 分 析 的 主要 功能 是 指 研究 涉及 物理 属性 的 
演变 ,或 者 导致 设备 失效 的 性 能 测量 标准 。 准 确 并 可 靠 的 预测 分 析 结 果 是 成 功 执 
行 基于 状态 的 工程 系统 维护 的 关键 因素 ,并 且 它 对 安全 性 能 的 改进 、 任 务 的 规划 、 
维修 时 间 表 的 制定 .降低 维修 成 本 和 减少 停工 时 间 等 都 起 着 至 关 重 要 的 作用 。 
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在 分 析 国 际 设备 健康 状态 预测 技术 的 发 展 并 完成 相关 文献 综述 的 过 程 中 ,本 
书 分 析 比 较 了 各 种 预测 技术 的 优 缺 点 。 其 中 , 隐 式 马尔 可 夫 模 型 (Hidden Mark- 
ove model, HMM) 在 模式 识别 领域 有 着 很 好 的 应 用 ,近年 来 才 被 引入 机 械 设备 健 
康 诊断 领域 中 ,并 有 了 一 定 应 用 . 但 HMM 技术 的 局 限 性 使 它 应 用 于 复杂 系统 的 
建 模 时 ,难以 对 真实 情况 做 出 高 精确 度 的 建 模 ,导致 其 结果 可 靠 度 不 高 。 隐 式 半 马 
尔 可 夫 模 型 是 HMM 的 衍生 模型 ,在 定义 完全 的 HMM 结构 上 加 入 了 时 间 组 成 部 
分 ,克服 了 因 马 尔 可 夫 链 的 假设 所 造成 的 局 限 性 。 在 解决 实际 问题 中 ,HSMM 能 
够 提供 更 好 的 建 模 和 分 析 能 力 ,提高 模式 分 类 的 精度 。 但 HSMM 很 少 应 用 于 机 
械 设 备 健康 诊断 和 预测 领域 , 且 已 有 的 HSMM 也 没有 很 好 地 描述 设备 的 性 能 退 
化 情况 。 在 结合 目前 设备 维护 的 实际 情况 的 基础 上 ,本 书 以 单 设备 系统 为 研究 对 
象 ,通过 对 基于 状态 的 设备 维护 优化 相关 内 容 的 研究 ,可 看 出 本 研究 的 目的 与 特色 
在 于 以 下 方面 。 

CD 将 考虑 设备 性 能 退化 的 隐 式 半 马 尔 可 夫 模型 与 失效 率 结合 ,用 于 单 监测 
信息 的 设备 在 线 健康 状态 分 析 及 寿命 预测 。 

(2) 基于 单 监测 信息 的 在 线 健康 预测 模型 ,考虑 多 监测 信息 的 设备 在 线 健康 
状态 分 析 及 寿命 预测 。 

(3) 在 考虑 备件 库存 成 本 对 维护 成 本 与 维护 风险 及 维护 效果 都 存在 影响 的 情 
况 下 ,基于 在 线 健 康 预 测 分 析 数 据 优化 设备 动态 维护 策略 。 

(4) 在 设备 在 线 健康 状态 有 效 预 测 的 基础 上 ,考虑 多 部 件 设 备 预测 性 维护 调 
度 优化 。 基 于 集成 维护 模型 ,对 多 部 件 设备 的 维护 调度 进行 优化 分 析 。 

针对 以 上 研究 目的 ,本 研究 从 预测 分 析 的 实际 运用 角度 出 发 ,提出 一 个 系统 地 
应 用 于 CBM 的 剩余 寿命 预测 模型 。 在 用 于 诊断 设备 健康 状态 和 预测 有 效 剩余 寿 
命 的 HSMM 中 ,引入 老化 因子 来 描述 设备 性 能 的 退化 趋势 。 与 现 有 的 HMM 诊 
断 模型 比较 ,考虑 了 性 能 退化 过 程 的 HSMM 更 贴 合 设备 在 使 用 中 的 实际 情况 ,能 
更 精确 地 描述 状态 转移 的 过 程 。 针 对 多 监测 信息 的 处 理 问题 ,设计 了 全 新 的 
HSMM, ,在 最 大 程度 上 融合 了 多 监测 信息 。 最 后 ,在 改进 后 的 预测 分 析 系 统 的 基 
础 上 ,对 如 何 将 预测 分 析 数据 运用 到 实际 的 设备 动态 维护 策略 中 进行 了 探索 研究 ， 
希望 能 进一步 提高 预测 分 析 模 型 用 于 实际 生产 维护 计划 制订 的 可 能 性 。 在 维护 策 
略 的 制定 上 ,兼顾 了 维护 成 本 和 设备 利用 率 两 个 指标 ,同时 在 维护 成 本 的 设计 中 创 
造 性 地 引入 了 备件 库存 成 本 。 在 四 类 成 本 的 设置 上 ,设备 更 换 成 本 设 为 常数 值 , 设 
备 维护 成 本 与 操作 成 本 是 和 系统 状态 及 系统 虚 龄 相关 的 函数 ( 虚 龄 的 具体 设置 见 
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第 5 章 , 其 取 值 与 设备 的 退化 状态 相关 ) ,备件 库存 成 本 与 设备 的 维护 策略 相关 。 
每 次 维护 执行 影响 的 设备 状态 参数 有 设备 健康 状态 转移 概率 和 设备 虚 龄 两 种 。 
围绕 设备 健康 预测 技术 ,开展 了 设备 的 维护 优化 研究 ,参照 国内 外 最 新 的 研究 
进展 和 成 果 , 主 要 创新 成 果 有 以 下 几 个 。 

(1) 针对 单 监测 信息 的 离线 预测 缺陷 和 性 能 衰退 特征 ,将 衰退 性 能 引入 在 线 
预测 模型 ,提出 了 在 线 联 合 多 步 向 前 健康 状态 识别 算法 ,描述 了 设备 从 正常 工作 状 
态 到 失效 状态 的 一 系列 退化 过 程 ,实现 了 对 设备 健康 状态 的 在 线 描述 ,建立 了 单 监 
测 信息 在 线 健 康 预测 模型 ,实现 了 在 线 健 康 预测 和 在 线 剩 余 寿命 估计 。 

(2) 针对 单 监测 信息 的 预测 精度 问题 ,利用 最 大 似 然 线 性 回归 方法 对 修正 
HSMM 进行 训练 ,提出 了 多 监测 信息 在 线 健康 预测 方法 ( 自 适 应 HSMM) ,建立 了 
多 监测 信息 的 在 线 剩余 寿命 估计 新 方法 ,实现 了 多 监测 信息 之 间 的 有 效 融合 ,可 以 
获得 更 符合 实际 的 设备 健康 状态 和 剩余 寿命 。 

(3) 针对 传统 的 设备 维护 方式 ,将 在 线 健康 预测 模型 结合 到 设备 的 维护 模型 
中 。 在 设备 的 维护 模型 中 ,考虑 了 设备 的 衰退 信息 (退化 信息 和 老化 信息 ) ,诊断 和 
预测 信息 ,资源 约束 (备件 和 维修 人 员 ) 等 ,建立 了 基于 在 线 健康 预测 的 双 层 集成 动 
态 维 护 模型 。 针 对 系统 的 维护 策略 问题 ,以 每 次 维护 活动 的 费用 和 总 的 维护 费用 
率 为 目标 ,基于 设备 健康 预测 与 集成 动态 维护 模型 ,考虑 设备 维护 的 调整 因子 、 多 
部 件 之 间 的 相关 性 和 维护 调度 资源 的 约束 ,建立 了 多 部 件 设备 的 维护 调度 优化 
模型 。 





1.4 研究 框架 


本 书 通 过 消化 吸收 设备 健康 状态 诊断 与 预测 的 最 新 理论 和 研究 成 果 , 在 对 当 
前 已 有 技术 的 优 劣 分 类 进行 分 析 、 比 较 、 研 究 后 ,选取 HSMM 对 设备 的 健康 状态 
退化 趋势 进行 预测 ,针对 维护 策略 进行 深入 研究 ,将 与 维护 策略 密切 相关 的 备件 库 
存 管理 纳入 维护 策略 的 优化 考虑 中 ,在 一 定 程度 上 拓宽 了 我 国 设备 维护 管理 的 研 
究 领 域 , 对 于 促进 我 国 设备 维护 管理 的 发 展 具有 较 高 的 理论 价值 和 现实 意义 。 

本 书 的 基本 思路 和 组 织 框架 如 图 1-1 所 示 。 
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| | 单 监测 信息 的 在 线 | | 
| | “使 康 预测 方法 “| | 
| | 多 监测 信息 的 在 线 | | 基于 在 线 健康 预测 
健康 预测 方法 。 | ; sonus Th 


基于 集成 维护 模型 的 维护 调度 
优化 研究 
应 用 案例 分 析 


1-1 本 书 的 基本 思路 和 组 织 框架 










1.5 本 章 小 结 


本 章 是 全 书 的 总 体 概述 ,概述 性 地 介绍 了 相关 的 研究 背景 ,在 实践 背景 的 基础 
上 提出 本 研究 主题 ,在 理论 背景 的 基础 上 将 研究 主题 细 化 成 具体 的 研究 问题 。 围 
绕 要 解决 的 具体 研究 问题 ,本 章 介绍 了 相关 的 研究 意义 .研究 目的 ,研究 框架 ,以 及 
结构 安排 和 研究 创新 。 本 章 既 是 全 书 的 概述 ,又 是 全 书 研究 的 逻辑 指导 。 


设备 维护 的 概念 





基于 状态 的 维护 (condition based maintenance, CBM) ,是 指 通过 对 设备 工作 
状态 和 工作 环境 的 实时 监测 ,对 设备 当前 的 健康 状况 进行 评估 ,并 利用 预 诊断 技术 
预测 设备 未 来 的 可 工作 寿命 。 本 章 回顾 了 机 械 设备 健康 预测 技术 的 已 有 研究 成 
果 , 分 析 了 预测 模型 在 故障 预报 中 的 重要 作用 ,阐述 了 设备 维护 的 发 展 过 程 ;最 后 ， 
对 这 两 个 领域 的 发 展 趋势 进行 了 讨论 ,提出 了 一 个 系统 性 的 预测 维护 框架 图 。 


2.1 5| 


Zi 


工业 设备 和 生产 系统 操作 的 可 靠 性 对 生产 型 企业 的 盘 利 能 力 与 竞争 能 力 都 有 
重要 影响 ,这 使 企业 对 工业 生产 过 程 和 生产 设备 维护 策略 的 重要 性 的 关注 日 益 增 
加 。 对 企业 生产 管理 而 言 , 制 定 一 个 行 之 有 效 的 维护 管理 系统 是 非常 必要 的 。 它 
可 以 帮助 企业 将 维护 成 本 维持 在 一 个 较 低 水 平 ,同时 使 所 有 的 设备 都 保持 高 效率 
的 运作 。CBM 作为 一 种 新 出 现 的 维护 决策 策略 ,推动 了 设备 故障 的 实时 诊断 技术 
和 设备 未 来 健康 状态 预测 技术 的 发 展 。 通 过 监测 系统 中 关键 性 组 件 的 当前 “ 状 
态 ”, 利 用 诊断 预测 技术 ,CBM 制定 出 相应 的 决策 来 执行 维护 9 。 系 统 设备 的 状 
态 通过 多 种 戏 人 式 传感器 的 定期 或 连续 信号 输出 和 (或 ) 利 用 便携 式 装 置 定期 测试 
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并 量化 获得 。 诊 断 和 预测 是 CMB 系统 中 非常 重要 的 两 部 分 。 系 统 发 生 异 常 状况 
时 ,诊断 涉及 对 故障 的 发 现 、 定 位 和 隔离 。 预 测 则 需要 在 系统 发 生 故 障 和 性 能 退化 
前 做 出 相应 的 预告 。CBM 的 目标 是 尽 可 能 在 有 显著 迹象 证 明 设 备 即 将 发 生 异 常 
行为 或 异常 物理 状态 时 采取 相对 应 的 维护 动作 ,以 此 来 避免 不 必要 的 维护 行为 。 
在 通常 情况 下 ,CBM 针对 不 同 的 设备 健康 状态 执行 相应 的 维护 行为 ,是 一 种 可 以 
有 效 减 少 不 必 要 维护 动作 的 设备 维护 方法 。 图 2-1 揭示 了 维护 成 本 、 有 效 剩余 寿 
fi (residualuseful life, RUL) 和 系统 可 靠 性 之 间 的 关系 。 当 距离 失效 点 的 时 间接 
近 0 时 ,系统 将 进入 失效 状态 ,不 能 正常 工作 。 当 距离 系统 的 失效 时 间 向 0 接近 
时 ,系统 的 可 靠 性 也 随 之 降低 。 在 CBM 系统 中 ,对 设备 和 零件 的 剩余 寿命 与 可 靠 
性 的 预测 信息 将 用 于 经 济 型 维修 计划 的 决策 和 制定 中 ,因此 ,预测 信息 的 准确 性 是 
至 关 重 要 的 。 

CBM 系统 中 的 预测 方法 是 近 几 年 才 被 逐渐 引入 技术 研究 中 并 逐渐 成 为 维护 
研究 和 发 展 中 的 一 个 热门 领域 的 。 目 前 已 有 不 少 的 模型 ,都 是 建立 在 从 系统 中 收 
集 来 的 信号 分 析 的 基础 上 的 。 在 未 来 的 维修 策略 研究 中 ,基于 信号 分 析 的 建 模 方 
法 可 能 会 促进 预测 模型 的 发 展 , 使 其 在 诊断 系统 当前 状态 的 同时 能 够 预测 未 来 的 
状态 趋势 。 





最 佳 维护 时 间 


mm 


故障 时 间 Die 


2-1 维护 成 本 .RUL 和 系统 可 靠 性 之 间 的 关系 


预测 主要 采用 自动 化 的 模型 探测 、 诊 断 和 分 析 物 理 系统 性 能 的 退化 ,并 计算 在 
不 可 接受 的 性 能 退化 发 生前 ,设备 处 于 可 接受 工作 状态 内 的 剩余 寿命 时 间 。 退 化 
分 析 的 主要 功能 是 研究 涉及 物理 属性 的 演变 ,或 者 导致 设备 失效 的 性 能 测量 标准 。 
准确 并 可 靠 的 预测 分 析 结 果 是 成 功 执行 基于 状态 的 工程 系统 维护 的 关键 因素 , 它 
对 安全 性 能 的 改进 ,任务 的 规划 、 维 修 时 间 表 的 制定 、 降 低 维修 成 本 和 减少 停工 时 


-0- 





RRS] 





第 2 章 


设备 维护 的 概念 


间 等 都 起 着 至 关 重 要 的 作用 。 虽 然 得 到 可 接受 准确 度 范围 内 的 预测 分 析 结 果 是 一 
件 非常 困难 的 事情 ,但 基于 状态 的 维护 所 涉及 的 预测 方法 学 还 是 在 近期 获得 了 越 
来 越 多 的 关注 。 

为 了 支持 维护 决策 的 制定 和 具有 一 定 操作 性 的 可 靠 性 管理 ,目前 已 有 许多 的 
方法 技术 在 各 方面 取得 了 不 错 的 研究 进展 。 这 些 方 法 按 其 性 质 特点 和 适用 对 象 被 
分 为 五 类 ,它们 被 视 为 通 向 决策 制定 管理 的 五 步 阶梯 ( 见 图 2-2)。 第 一 步 是 机 械 设 
备 的 先 验 知识 ;第 二 步 是 数据 的 收集 方法 ;第 三 步 是 数据 的 预 处 理 方法 ,包括 数据 
提取 、 转 换 和 分 析 等 ;第 四 步 是 基于 信和 号 的 故障 诊断 ;第 五 步 是 基于 数据 和 诊断 的 
预测 分 析 。 






数据 预 处 理 LI 
(数据 提取 等 ) 


2-2 基于 预测 性 维护 的 阶梯 形 技术 模块 


目前 已 有 一 些 关 于 预测 技术 的 综述 文章 。Katipamula 和 Brambley"? , Jar- 
dinel"?! 等 学 者 都 针对 预测 的 当前 发 展 状 态 进行 了 简单 的 综述 工作 ,但 是 他 们 的 综 
述 文章 更 偏重 于 研究 诊断 技术 方面 。Schwabacher 和 Goebel"! 对 人 工 智能 Carti- 
ficial intelligence, AD 和 机 器 学 习 (machine learning, ML) 的 概念 进行 了 重新 定义 ， 
并 在 此 基础 上 对 AI 和 ML 在 预测 中 的 应 用 情况 做 了 综述 工作 。Zhang 和 Li!" ， 
以 及 Kothamasul 等 人 5 尝试 将 近年 来 关于 应 用 在 基于 状态 维护 中 的 故障 诊断 技 
术 的 研究 和 发 展 工作 进行 了 总 结 。 在 对 一 系列 相关 文献 进行 综述 工作 的 基础 上 ,这 
些 学 者 对 未 来 故障 诊断 和 预测 技术 在 实际 应 用 方面 的 发 展 与 挑战 提出 了 一 些 见 解 和 
看 法 ,包括 需要 发 展 快速 并 且 准 确 度 高 的 设备 健康 状态 预测 技术 ,建立 行 之 有 效 的 故 
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障 确认 方法 ,并 研究 开发 相关 的 预测 软件 包 。Goh 等 学 者 中 介绍 了 目前 已 应 用 于 预 
测 维 护 中 的 一 些 典 型 技术 理论 ,并 对 不 同 的 预测 技术 进行 了 SWOT (strengths, 
weaknesses,opportunities and threats) 分 析 。 在 前 述 的 综述 文献 中 ,所 涉及 的 理论 
方法 大 多 限于 一 些 传 统 的 、 典 型 的 技术 ,如 人 工 神经 网 络 (artificial neural net- 
work, ANN) .模糊 逻辑 学 (fuzzy logic,FL) 和 专家 系统 (expert system,ES) 等 。 

近年 来 ,已 有 关于 机 械 设备 的 预测 理论 及 其 实际 应 用 方面 的 大 量 论文 发 表 于 
众多 的 与 维修 和 可 靠 性 相关 的 国际 会 议和 期 刊 上 。 许 多 曾经 成 功 运 用 于 其 他 领域 
的 传统 方法 学 被 逐渐 引入 设备 健康 预测 的 研究 中 ,同时 也 有 一 些 全 新 的 技术 及 方 
法 涌现 于 此 研究 领域 内 。 为 了 提高 预测 模型 的 准确 性 ,一 些 学 者 也 尝试 将 两 个 或 
三 个 模型 结合 在 一 起 来 建立 一 个 组 合 模 型 。 大 体 来 说 ,预测 模型 可 分 为 四 类 :物理 
模型 .基于 知识 库 的 模型 数据 挖掘 的 模型 和 组 合 模 型 。 文 献 综述 在 基于 模型 的 分 
类 基础 上 进行 ,对 通常 情况 下 应 用 于 不 同 模型 的 理论 技术 按 所 属 模型 进行 了 分 类 ， 
并 按 类 别 顺序 对 多 种 技术 和 方法 进行 了 介绍 与 评估 分 析 , 对 一 些 传统 的 典型 方法 
和 新 引入 方法 的 优 缺 点 各 自 进行 了 分 析 比 较 与 讨论 。 本 章 综述 的 组 织 结构 如 下 : 
第 2 节 介绍 物理 模型 ,基于 知识 驱动 的 方法 ,基于 数据 驱动 的 模型 ,基于 模型 驱动 
的 方法 ,基于 模型 驱动 的 方法 和 混合 模型 ,并 在 相应 章节 中 对 应 用 于 上 述 模型 的 技 
术 分 类 进行 了 综述 ;第 3 节 对 目前 已 有 的 一 些 维护 方法 进行 了 综述 ;第 4 节 通 过 对 
此 研究 领域 中 日 渐 增 长 的 一 些 研 究 趋势 进行 总 结 , 指 出 目前 研究 中 存在 的 一 些 问 
题 ,探索 了 未 来 预测 维护 发 展 中 某 些 可 能 的 研究 方向 和 研究 趋势 。 





2.2 设备 健康 管理 的 历史 发 展 


设备 维护 是 以 企业 生产 经 营 目标 为 依据 ,以 提高 设备 效能 为 目的 ,在 调查 研究 
的 基础 上 ,运用 各 种 技术 、 经 济 和 组 织 措施 ,对 设备 在 使 用 与 运行 .维护 与 修理 、 改 
造 、 更 新 直至 报废 的 过 程 中 进行 的 管理 "9 。 设 备 维护 的 研究 领域 广泛 ,与 现代 工 
程 技术 和 管理 科学 的 理论 发 展 密切 相关 。 

传统 的 设备 维修 方式 有 定期 维修 (time based maintenance. TBM) 事后 维修 
(breakdown maintenance. BM) 和 中 途 抢修 (emergency maintenance,EM) 等 ,其 中 
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最 主要 的 是 TBM。TBM 按 规定 的 产品 维修 间隔 期 实施 维修 ,如 润滑 、 磨 光 、 校 准 、 
检查 等 ,属于 预防 性 维修 的 一 种 。 维 修 间 隔 一 旦 制定 后 ,通常 不 再 随意 改变 ,是 一 
个 静态 的 设备 维修 策略 。 随 着 系统 和 设备 复杂 度 的 提高 ,TBM 越 来 越 暴露 出 其 局 
限 性 。 例 如 ,不 必要 的 维修 会 增加 故障 率 ,影响 设备 的 性 能 或 质量 ,造成 过 剩 维修 。 
并 且 大 型 复杂 设备 与 系统 的 每 次 维修 都 会 消耗 大 量 的 人 力 、 物 力 ,提高 生产 
mA 。 

随 着 设备 复杂 程度 的 增加 ,企业 对 设备 维修 能 力 的 要 求 也 逐步 提高 。 在 泰勒 
的 科学 管理 思想 被 普遍 接受 的 时 候 , 设 备 维 护 管理 作为 企业 管理 的 一 个 单独 组 成 
部 分 而 独立 出 来 。 随 着 工业 生产 的 发 展 ,设备 现代 化 水 平 的 不 断 提高 ,设备 维护 的 
发 展 过 程 大 致 经 历 了 四 个 阶段 2 :@ 事 后 维修 阶段 (1950 年 前 );@ 预 防 性 维修 
阶段 (1950 一 1970 年 );@ 综 合 管理 阶段 (1970 一 1980 年 );@ 多 种 维护 方式 并 存 , 其 
中 以 CBM 为 代表 (1980 年 后 至 今 ) 。 

CBM 属于 预防 性 维护 的 高 级 发 展 阶段 。 设 备 运行 时 ,大 多 数 故 障 从 发 生 到 发 
展 阶 段 会 出 现 一 段 时 间 的 异常 ,并 且 会 出 现 相 应 征兆 。 如 果 采 取 一 定 的 预防 措施 ， 
可 能 就 会 避免 故障 发 生 或 者 减缓 故障 后 果 。CBM 在 实施 过 程 中 ,可 以 对 设备 的 性 
能 退化 进行 实时 的 监控 ,评估 和 趋势 预测 ,并 按照 实际 需求 制订 维护 计划 ,在 防止 
设备 因 故 障 停机 的 同时 ,最 大 限度 地 提高 设备 的 利用 率 , 人 避免 宛 余 维护 ,降低 设备 
的 维护 成 本 。CBM 不 仅 可 以 提供 设备 性 能 退化 监测 的 解决 方案 ,而 且 可 以 让 企业 
在 制定 维护 策略 和 准备 维护 资源 (如 备件 等 ) 时 拥有 更 充足 的 时 间 余 量 , 特 别 是 在 
备件 库存 管理 上 ,使 维护 所 需 的 备件 库存 在 保证 供给 的 情况 下 ,可 以 有 效 减 低 库存 
水 平 ,节约 维护 所 需 的 库存 成 本 。CBM 拥有 高 效 .节能 等 诸多 优点 ,但 也 涉及 许多 
专业 技术 的 应 用 ,实施 起 来 难度 较 大 。 目 前 ,CBM 涉及 的 大 量 专 业 领 域 知识 有 信 
号 处 理 、 模 式 识别 .数据 挖掘 等 。 人 工 神经 网 络 ` 贝 叶 斯 模型 .模糊 理论 .专家 知识 
系统 等 方法 在 该 领域 得 到 了 广泛 的 应 用 和 发 展 。 

近年 来 ,虽然 我 国 工业 行业 的 快速 发 展 使 国内 生产 行业 的 维护 管理 在 纵向 上 
取得 了 较 大 的 进步 ,但 与 国外 同行 横向 比较 , 仍 存在 很 大 的 差距 。 目 前 ,国内 企业 
在 维修 方面 普遍 存在 的 问题 和 缺 隐 有 以 下 方面 .329 

(1) 企业 缺乏 系统 的 设备 维护 知识 基础 和 明确 的 设备 维护 目标 。 设 备 维护 只 
是 简单 地 更 换 失效 的 零 部 件 , 缺 乏 完整 的 设备 维护 计划 和 对 维护 管理 的 系统 研究 
和 开发 。 

(2) 设备 维护 管理 系统 落后 ,通常 采取 被 动 式 而 不 是 主动 式 维护 。 
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(3) 时 常 存在 维修 不 彻底 或 维修 过 剩 产生 高 昂 的 维修 费用 ,同时 不 适当 的 维 
修造 成 大 量 的 生产 损失 。 

(4) 缺乏 预算 控制 ,维护 预算 分 配 不 当 , 使 企业 缺乏 维护 资源 。 

(5) 缺少 管理 层 的 支持 ,大 多 数 的 维护 自动 化 程度 低 , 维 护 系统 的 智能 性 和 拓 
展 性 差 , 升 级 困难 。 

总 体 而 言 ,我 国 设备 的 维护 管理 还 处 于 初级 发 展 阶段 。 以 上 存在 的 维护 问题 ， 
制约 了 我 国 工 业 行业 设备 维护 管理 的 发 展 ,降低 了 制造 业 的 经 济 效益 和 竞争 能 力 。 


2.3 设备 健康 预测 方法 的 研究 及 进展 


基于 状态 监测 的 设备 寿命 预测 ,具体 而 言 ,主要 是 在 设备 A 运行 的 某 一 时 刻 
上 根据 监测 的 (至 时 刻 : 的) 设备 A 的 运行 状态 和 /或 同类 设备 的 历史 数据 ,预测 设 
备 A 由 当前 至 失效 的 剩余 寿命 (residual life) 。 这 里 ,历史 数据 既 可 以 是 从 运行 到 
失效 过 程 中 的 状态 监测 数据 ,也 可 以 是 失效 时 间 数 据 、 维 护 时 间 数 据 等 事件 数据 ， 
还 可 以 是 两 者 的 综合 。Jardine 等 人 号 将 剩余 寿命 表述 为 
T—t|T>1,2Z0) (2-1) 
其 中 ,T 为 失效 时 刻 的 随机 变量 ;: 为 当前 时 刻 ; 向 量 Z(z) 为 至 当前 的 状态 数据 。 
更 全 面 地 ,将 式 (2-1) 拓 展 为 
T—t| T2 #2Z0) (2 (0) ,Ey) (2-2) 
其 中 ,ZZ (v) 为 同类 设备 j 在 其 运行 时 刻 v 的 状态 数据 ;向 量 Ei 为 同类 设备 j 的 事 
件数 据 ( 尤 其 是 失效 时 刻 数据 );w€ [0.0]. v € [04 T ].j 1.2. LL 为 可 获得 
历史 数据 的 同类 设备 的 个 数 ;Tj 为 同类 设备 j 的 最 终 失 效 时 刻 。 
寿命 预测 , 既 指 预测 变量 T — c 的 分 布 ,有 时 也 指 预测 变量 T 一 : 的 期 望 259 , 即 
E(T—¢| T>¢t,Z(u).(Zy (v) Ey] (2-3) 
因此 ,设备 的 健康 预测 表 主 要 包括 以 下 基本 内 容 。 
(1) 状态 监测 技术 。 在 设备 运转 过 程 中 , 尽 可 能 精确 地 利用 传感器 的 监测 获 
得 设备 的 运行 状态 信息 ,利用 先进 的 数据 分 析 技术 精确 评估 设备 的 健康 状态 。 
(2) 设备 预测 技术 。 在 设备 运转 过 程 中 ,如 果 设 备 出 现 小 故障 或 缺陷 ,或 者 
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说 ,设备 的 性 能 状态 逐渐 衰退 而 不 能 最 佳 地 完成 功能 时 ,利用 设备 的 监测 数据 , 预 
测 设备 的 小 缺陷 、 小 故障 和 衰退 状态 ,包括 寿命 预测 和 状态 预测 两 个 方面 的 内 容 。 

(3) 设备 诊断 技术 。 在 设备 运转 过 程 中 ,及 早 发 现 设备 的 故障 或 者 有 潜在 故 
障 的 零 部 件 是 很 重要 的 ,虽然 一 次 故障 还 不 足以 影响 设备 的 运转 ,使 设备 完全 失 
效 , 但 这 都 是 潜在 的 早期 故障 ,需要 建立 分 类 性 能 优越 的 模型 和 数据 提取 技术 来 诊 
断 设备 。 

(4) 信息 融合 技术 。 单 传感器 的 数据 监测 不 能 精确 反映 设备 的 状态 ,需要 多 
传感器 数据 之 间 的 协同 性 .互补 性 和 竞争 性 ,以 进行 有 效 的 监测 .诊断 和 预测 ,高 效 
率 地 将 监测 数据 进行 有 效 融 合 处 理 ,实现 更 精确 的 健康 预测 。 

在 文献 中 ,设备 寿命 预测 的 方法 主要 可 以 分 为 59 :基于 物理 (第 一 原理 ) 的 方 
法 、 基 于 知识 驱动 的 方法 、 基 于 数据 驱动 的 方法 .基于 模型 驱动 的 方法 和 基于 信息 
融合 的 方法 。 


2.3.1 基于 物理 模型 的 方法 


基于 物理 模型 的 方法 通常 采用 数学 模型 来 描述 那些 会 直接 或 间接 影响 相关 组 
件 健康 状态 的 物理 过 程 。 物 理 模 型 大 多 由 特定 领域 的 专家 建立 ,通过 对 大 量 历史 
数据 的 分 析 来 确立 模型 的 参数 。 基 于 物理 模型 的 方法 用 于 设备 的 健康 状态 预测 
时 ,需要 模型 设计 者 掌握 与 系统 监控 相关 的 专业 机 械 理 论 和 方法 。 

基于 物理 模型 的 方法 使 用 残 差 值 作为 特征 值 。 残 差 值 的 获得 来 自 对 两 组 来 源 
不 同 的 数据 不 断 地 同时 进行 检测 核对 ,这 两 组 数据 分 别 来 自 安 置 于 某 物 理 系统 上 
的 传感器 发 出 的 信号 和 对 应 建立 的 数学 模型 中 的 输出 值 ( 见 图 2-3)。 这 类 方法 的 
前 提 是 在 正常 的 扰动 .噪声 和 模型 误差 的 影响 下 , 残 差 值 低 于 预 设 值 ,在 系统 故障 


优先 
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历史 
数据 





2-3 CBM 中 基于 物理 模型 方法 的 流程 
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出 现 的 时 候 超过 预 设 值 。 可 用 统计 方法 来 设 定 确定 故障 出 现 的 阔 值 。 基 于 物理 系 
统 的 方法 适用 于 那些 可 以 运用 第 一 原则 建立 起 精确 数学 模型 的 状况 。 这 些 模 型 只 
能 被 应 用 于 对 应 的 被 监控 特定 系统 ,并 且 在 输入 命令 信号 时 ,能 通过 仿真 做 出 精确 
的 系统 反应 。 另 外 ,此 类 模型 需要 能 够 被 用 于 组 件 失 效 的 仿真 ,这 种 仿真 和 物理 失 
效 实验 不 同 , 它 不 会 产生 在 真实 硬件 上 进行 故障 播 撤 的 费用 。 

物理 模型 在 多 种 不 同 操作 条 件 下 均 可 以 使 用 。 在 一 个 智能 监控 系统 中 ,在 各 
类 工作 负载 中 ,包括 稳定 状态 .转换 状态 和 预计 外 的 特殊 状况 (特殊 负载 ,不 同 操作 
机 制 ) 等 ,物理 模型 都 能 良好 地 运作 。 因 为 对 系统 物理 状况 的 理解 已 经 被 纳入 监控 
系统 的 模型 中 ,在 多 种 状况 下 ,特征 向 量 的 改变 和 模型 参数 紧密 相关 。 因 此 ,在 偏 
移 的 参数 变量 和 需要 进行 预测 的 健康 特征 间 可 以 建立 映射 函数 。 进 一 步 而 言 , 当 
对 系统 退化 的 物理 理解 发 展 得 更 加 深刻 时 ,通过 对 模型 进行 相应 的 修改 ,此 类 模型 
可 以 对 更 加 微小 的 故障 做 出 预测 ,并 且 预 测 精确 度 也 可 随 之 提高 。 虽 然 物理 模型 
具有 上 述 诸 多 优点 ,但 它 的 使 用 受到 一 定 限制 ,原因 在 于 建立 模型 的 花费 高 郧 ,并 
且 具 有 很 强 的 组 件 针对 性 ,每 一 个 物理 模型 只 能 应 用 于 对 应 的 特定 机 械 组 件 
中 5 。 而 且 , 建 立 一 个 性 能 优异 的 物理 模型 是 非常 困难 的 。 常 见 的 物理 模型 主要 
包括 裂缝 扩展 模型 .损伤 扩展 模型 .裂纹 诊断 与 预测 方法 等 。 

Glodez?" 497 T — FRAN Paris 方程 来 模拟 裂缝 扩展 的 模型 进行 齿轮 寿命 的 预 
测 ,这 个 模型 利用 寿命 预测 法 计算 萌生 的 裂缝 所 需要 的 齿轮 应 力 循环 的 数量 ,通过 
位 移 相 关 计算 法 来 获得 裂纹 长 度 和 强度 因子 间 的 函数 关系 ,文献 "中 通过 传感器 的 
监测 信号 对 材料 的 裂纹 演化 建立 随机 模型 ,从 而 ,有 效 估计 材料 的 剩余 寿命 .材料 
裂纹 的 长 度 及 演化 速率 。 文 献 C 根据 齿轮 的 动力 学 特性 方程 ,建立 了 在 线 估计 、 
更 新 齿轮 的 吵 合 刚度 及 系数 的 模型 。 基 于 齿轮 的 哮 合 刚度 及 系数 不 断 变 化 ,裂纹 
扩展 优化 模型 被 用 来 进行 齿轮 剩余 寿命 预测 。 文 献 C] 建立 了 一 种 基于 物理 的 转 
轴 袭 纹 的 诊断 和 预测 方法 。 文 献 59 建立 了 一 种 基于 有 限 元 法 的 齿轮 裂纹 长 度 的 
估计 模型 ;一 种 齿轮 动力 学 的 仿真 器 ;一 种 获取 齿轮 应 力 强度 因子 仿真 器 、 一 种 齿 
轮 的 剩余 寿命 预测 模型 。 由 齿轮 的 刚度 演化 产生 的 动态 载荷 在 齿轮 裂纹 的 扩展 过 
程 中 被 考虑 。 文 献 中 将 齿轮 的 失效 分 为 齿轮 橡 纹 产生 及 齿轮 裂纹 演化 两 个 阶段 ， 
Neuber 原理 被 用 来 估计 在 裂纹 产生 阶段 的 萌生 循环 数 ,在 裂纹 的 扩展 阶段 ,Paris 
公式 被 用 来 获得 在 裂纹 裂纹 演化 阶段 转变 到 失效 时 的 循环 数 。 当 建立 基于 状态 监 
测 的 裂纹 长 度 预测 模型 后 ,该 模型 可 用 于 取代 Paris 公式 来 估计 裂纹 扩展 到 失效 长 
度 的 概率 分 布 。 
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文献 5 建立 了 一 个 轴承 故障 诊断 模型 和 轴承 的 损伤 扩展 优化 模型 。 根 据 传 
感 器 检测 的 信息 ,轴承 诊断 模型 被 用 于 估计 缺陷 的 有 效 尺寸 ,轴承 损伤 扩展 优化 模 
型 被 用 来 获得 缺陷 的 扩展 率 ,以 及 未 来 时 刻 的 轴承 损伤 尺寸 ,通过 优化 算法 ,对 诊 
断 模型 及 损伤 模型 的 参数 利用 模型 预测 偏差 进行 在 线 更 新 。 文 献 把 确定 性 的 
损伤 扩展 优化 模型 扩展 到 随机 的 损伤 扩展 优化 模型 。 文 献 * 1 对 系统 的 失效 过 
程 进行 重新 分 类 ,根据 系统 的 损伤 演化 过 程 原理 说 明了 系统 的 动态 性 。 文 献 假 设 
了 系统 的 动态 性 是 可 以 被 观测 的 ,并 且 是 被 某 种 常 微分 方程 所 控制 的 ,无 须 了 解 常 
微分 方程 的 优化 模型 。 文 献 中 是 对 文献 ”中 研究 内 容 的 更 好 延伸 ,通过 结合 设 
备 的 状态 检测 信息 与 健康 预测 的 物理 模型 ,提高 设备 的 寿命 预测 精度 。 

文献 5 对 设备 监测 信息 的 有 效 融合 架构 以 及 融合 模型 进行 了 有 效 的 分 析 , 提 
出 了 关于 轴承 故障 诊断 及 健康 预测 的 定义 , 且 在 轴承 的 碎 裂 发 生 后 ,通过 碎 裂 扩展 
预测 模型 进行 轴承 寿命 预测 。 文 献 55 构 建 了 一 种 碎 裂 扩展 方程 ,联合 有 限 元 计算 
方程 中 需要 的 碎 裂 周围 的 应 力 ,从 而 进行 轴承 寿命 预测 。 也 讨论 了 基于 在 线 故障 
诊断 结果 来 更 新 预测 模型 的 方法 。 文 献 C5 根 据 振动 及 力学 内 容 , 轴 承 系统 的 健康 
预测 模型 被 建立 ,有 效 结合 了 系统 固有 的 振动 频率 及 振动 幅 值 .系统 的 失效 时 间 及 
服务 时 间 ,系统 的 振动 技术 被 用 来 获得 其 故障 时 间 。 文 献 " 外 利用 线性 损伤 方法 理 
论 来 估计 电路 板 上 的 焊 点 的 损伤 变化 情况 及 数量 ,使 用 同一 个 方法 对 焊 点 的 剩余 
寿命 进行 有 效 估计 。 通 过 实验 说 明 , 样 本 剩余 寿命 的 均值 可 以 利用 线性 损伤 方法 
理论 来 获得 较 好 的 结果 。 在 文献 中 中 , 印 制 电 路 板 在 振动 载荷 情况 下 的 响应 通 
过 应 变 计 进行 监测 ,后 续 的 焊 点 应 变性 通过 解析 模型 进一步 获得 , 焊 点 的 损伤 累积 
通过 Mine 原理 进行 有 效 估计 ,同时 ,可 以 获得 其 剩余 寿命 。 文 献 ** 江 也 应 用 设备 
的 监测 振动 信号 ,对 齿轮 和 设备 的 健康 状态 进行 预测 。 


2.3.2 ”基于 知识 驱动 的 方法 


在 实际 运用 中 ,运用 先 验 经 验 为 一 个 物理 系统 建立 精确 的 数学 模型 在 通常 情 
况 下 是 一 件 非 常 困难 的 事情 。 物 理 模型 的 运用 常常 因此 受到 了 很 多 的 限制 。 鉴 于 
此 缺点 ,不 需要 物理 模型 的 基于 知识 库 的 方法 显得 更 有 发 展 前 途 。 专 家 系统 
(expert system, ES) 和 模糊 逻辑 是 基于 知识 库 的 方法 中 比较 常见 的 两 个 例子 。 

1. 专家 系统 

专家 系统 在 化 学 .数学 ,物理 .生物 .医学 .农业 ,气象 .地 质 勘 探 ,军事 .工程 技 
AR 法律 商业、 空间 技术 .自动 控制 .计算 机 设计 和 制造 等 诸多 领域 都 有 应 用 ,在 实 
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际 应 用 中 产生 了 巨大 的 经 济 效益 5 。 建 立 专家 系统 的 步骤 涉及 知识 获取 、 知 识 
述 和 模型 的 确立 三 部 分 。 其 中 ,知识 获取 是 比较 困难 ,同时 也 是 相当 重要 的 一 个 阶 
段 。 所 获知 识 的 质量 对 整个 系统 的 性 能 起 着 至 关 重 要 的 作用 。 

近年 来 ,专家 系统 在 人 工 智能 领域 发 挥 了 重要 作用 , 它 被 广泛 运用 于 故障 诊断 
和 预测 应 用 中 中。 通常 专家 系统 用 于 对 系统 的 解释 、 监 控 和 诊断 ,并 对 预防 性 及 
预测 性 修理 动作 和 维护 行为 做 出 计划 。 基 于 规则 的 专家 系统 将 领域 内 专家 的 知识 
进行 整理 并 遵循 一 定 的 规则 表达 出 来 。 这 些 规 则 可 以 是 特殊 的 领域 规则 ,启发 式 
规则 或 来 自 于 经 验 的 规则 ,也 可 以 通过 逻辑 处 理 器 将 这 些 规则 串联 为 规则 链 使 
FAV?) 。 基 于 规则 的 知识 系统 在 对 专家 领域 知识 的 提取 概括 上 十 分 有 效 ,但 是 将 领 
域 知识 转化 为 规则 却 比较 困难 5] 。 一 旦 专家 系统 被 建立 后 , 它 不 能 够 处 理 它 的 知 
识 库 内 规则 所 未 涵盖 的 新 情况 。 而 且 , 当 知识 库 内 的 规则 数量 急剧 增加 时 ,可 能 会 
因为 大 量 计算 的 问题 导致 计算 机 的 “组 合 爆炸 ”。 

早 在 1989 年 ,Lembessis! 急 就 建立 了 一 个 实时 专家 系统 用 于 故障 诊断 ,该 系统 
可 以 连续 地 监测 工业 设备 的 健康 状态 。 随 后 ,专家 系统 在 设备 故障 诊断 领域 蓬勃 
发 展 ,得 到 了 广泛 的 应 用 。Butlert 写 提出 一 个 专家 系统 框架 用 于 故障 的 探测 和 预 
测 性 维护 (failure detection and predictive maintenance,FDPM)。FDPM 系统 由 无 
数 个 与 专家 系统 相关 的 组 件 和 数据 库 组 成 ,其 中 数学 模型 和 神经 网 络 模型 得 到 了 
很 好 的 运用 。 它 可 以 评估 一 个 能 源 分 配 系统 中 组 件 的 完好 性 ,并 对 维护 需求 做 出 
有 效 预 测 。Biagetti 和 Sciubbar 轨 设计 了 一 个 命名 为 PROMISE (prognostics and 
intelligent monitoring expert system) 的 预测 及 智能 检测 专家 系统 。 该 系统 可 以 针 
对 存在 的 严重 故障 生成 对 应 的 实时 信息 ,对 未 来 时 间 范 围 内 发 生 的 可 测 故 障 或 可 
能 性 故障 做 出 预测 ,并 对 如 何 控制 问题 给 出 建议 。 

2. 模糊 逻辑 

模糊 模型 是 一 种 重要 的 非 线性 映射 模型 , 它 能 在 模糊 、 不 明确 .不 准确 .噪声 或 
者 遗漏 信息 存在 的 情况 下 ,提供 一 种 简单 的 方法 对 信息 做 出 定义 ,并 得 到 解决 问题 
的 方法 。 它 善于 表达 界限 不 清晰 的 定性 知识 与 经 验 , 借 助 隶属 度 函 数 概念 ,区 分 模 
糊 集合 并 处 理 模糊 关系 ,模拟 人 脑 实施 规则 型 推理 ,解决 种 种 不 确定 问题 pc?] 。 通 
过 语言 变量 的 使 用 ,模糊 逻辑 提供 了 一 种 模仿 人 脑 的 不 确定 性 概念 判断 、 推 理 思维 
方式 ,对 于 模型 难以 确定 甚至 未 知 的 系统 对 象 ,以 及 非 线 性 ,滞后 性 严重 的 控制 对 
象 ,实行 模糊 综合 判断 ,因此 它 在 处 理 复杂 系统 的 大 时 沾 和 非 线 性 方面 显示 出 了 独 
特 的 优越 性 。 模 糊 模型 的 最 大 特点 是 其 模糊 规则 库 可 以 直接 利用 专家 知识 构造 ， 
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因而 能 够 充分 利用 ,并 有 效 处 理 专 家 的 语言 知识 和 经 验 , 而 且 一 个 适当 设计 的 模糊 
逻辑 系统 可 以 在 任意 精度 上 逼近 某 个 给 定 的 非 线性 函数 。 它 应 用 模糊 集合 和 模糊 
规则 进行 推理 ,表达 过 渡 性 界限 或 定性 知识 经 验 , 模 拟人 脑 思维 方式 来 推理 解决 常 
规 方法 难以 对 付 的 规则 型 模糊 信息 问题 和 9。 

与 传统 的 布尔 逻辑 比较 ,模糊 逻辑 集合 成 员 的 取 值 可 以 为 真 或 者 为 伪 , 它 允许 
成 员 属 于 一 个 或 多 个 模糊 集 , 这 意味 着 在 模糊 系统 中 ,所 有 的 规则 都 可 以 得 到 运用 
并 且 每 条 规则 对 输出 的 结果 都 有 一 定 影 响 。 但 是 在 精确 系统 中 ,有 且 仅 有 一 条 规 
则 可 以 被 选中 使 用 "9 。 模 糊 逻辑 使 定性 的 和 不 精确 的 推理 陈述 可 以 用 于 基于 规 
则 的 系统 ,并 产生 更 加 简单 和 直观 且 性 能 更 优异 的 行为 模型 。 和 数学 描述 相 比 , 模 
糊 逻辑 的 语言 对 系统 的 描述 更 有 效 ,并 且 减 少 了 特殊 性 。 因 此 ,通过 模糊 逻辑 规则 
下 概念 的 引入 ,使 管理 维护 动作 日 程 的 不 确定 性 成 为 可 能 ,提高 了 故障 诊断 和 预测 
方法 的 鲁 棒 性 ,增加 了 诊断 和 预测 结果 的 可 靠 度 。 近 年 来 , 随 着 模糊 理论 的 深入 研 
究 , 模 糊 模 型 在 故障 预测 中 得 到 越 来 越 多 的 应 用 。 例 如 ,在 用 于 故障 预测 的 模糊 模 
型 中 ,利用 模糊 集合 理论 与 模糊 迎 辑 关系 ,在 模糊 知识 的 表达 上 使 用 故障 与 传感器 
参数 之 间 的 隶属 关系 ,建立 对 应 的 模糊 关系 矩阵 。 

模糊 模型 作为 一 种 半 定 量 方法 ,在 知识 表述 和 推理 方面 的 独特 规则 显示 出 了 
巨大 的 优势 。 因 此 ,一 般 把 模糊 模型 与 其 他 模型 相 结 合 ,如 应 用 于 专家 系统 、 卡 曼 
滤波 .人 工 神 经 网 络 中 等 ,使 模型 发 挥 更 好 的 效果 。Choic 研 发 了 一 个 名 为 AFDS 
(alarm filtering and diagnostic system) 的 警报 过 滤 和 故障 诊断 系统 ,该 系统 使 用 
一 个 在 线 模糊 专家 系统 ,能够 在 系统 进入 异常 状态 时 提供 无 缺陷 的 警报 图 片 和 系 
统 层面 上 的 失效 信息 ,同时 对 系统 操作 者 发 出 关于 程序 异常 性 的 预测 警报 。 另 一 
个 基于 模糊 模式 识别 规则 的 自 适应 性 预测 系统 由 Frelicot[5 设 计 建立 。 系 统 中 的 
模糊 分 类 规则 包含 了 隶属 度 拒绝 权 和 模糊 拒绝 权 , 并 通过 此 规则 的 运用 对 故障 进 
行 诊断 。 为 了 从 隶属 度 拒绝 模式 中 提取 新 的 错误 模式 ,一 个 基于 模糊 聚 类 的 自学 
习 程 序 被 定期 激活 。 同 时 ,一 个 多 步 的 自 适 性 卡 曼 滤波 被 引入 系统 ,对 隶属 度 向 量 
进行 不 断 修正 ,提高 预测 结果 的 可 靠 性 。 文 献 5 将 模糊 理论 应 用 于 人 工 神经 网 
络 ,在 神经 网 络 框架 下 引入 知识 的 定性 表达 。 该 组 合 网 络 结合 了 模糊 理论 与 人 工 
神经 网 络 的 优势 ,和 一 般 神 经 网 络 相 比 ,具有 更 强 的 针对 性 。 

模糊 模型 适用 于 对 复杂 系统 的 预测 ,但 目前 模糊 预测 系统 仍 处 于 研究 的 初始 
发 展 阶段 。 在 模糊 预测 系统 中 ,由 于 静态 知识 库 无 法 反映 设备 零 部 件 的 失效 过 程 ， 
使 故障 预测 系统 的 知识 表达 不 能 包含 时 间 参 数 , 不 能 对 预测 对 象 实现 实时 监控 , 削 
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弱 了 方法 的 实用 性 ,因此 需要 对 动态 知识 库 的 建造 技术 进行 进一步 研究 和 运用 。 
2.3.3 基于 数据 驱动 的 方法 


数据 挖掘 是 从 大 量 数据 知识 中 发 现 过程 的 一 个 重要 步骤 , 它 是 从 大 量 不 完全 
的 \ 有 噪声 的 、 模 糊 的 、 随 机 的 数据 中 提取 隐 含 在 其 中 的 有 用 的 信息 和 知识 ,是 在 一 
些 事实 或 观察 数据 集合 中 寻找 模式 的 决策 支持 过 程 5] 。 它 综合 了 人 工 智能 、 模 式 
识别 .计算 智能 (人 工 神 经 网 络 .遗传 算法 ) 数理 统计 等 先进 技术 ,目前 已 成 为 计算 
机 科学 研究 中 的 前 沿 活跃 领域 之 一 ,在 市 场 分 析 、 金 融 投资 ,医疗 卫生 、 环 境 保护 、 
产品 制造 和 科学 研究 等 领域 都 获得 了 广泛 的 应 用 ,近年 来 也 被 引入 基于 状态 的 机 
械 设备 维护 领域 中 。 把 数据 挖掘 应 用 在 机 械 设 备 故障 诊断 与 预测 中 ,是 指 根据 机 
械 设备 的 历史 运行 记录 ,对 它 可 能 的 运行 状态 进行 分 类 ,并 基于 历史 数据 反映 的 运 
行情 况 , 对 它 未 来 的 运行 趋势 进行 预测 。 

基于 数据 驱动 的 设备 健康 预测 方法 ,根据 设备 运行 状态 的 监测 数据 ,通过 设备 
预测 模型 ,可 用 确定 性 的 失效 阔 值 或 失效 面 定义 设备 失效 。 通 过 对 设备 的 失效 阔 
值 和 未 来 状态 的 分 析 , 对 设备 的 失效 时 刻 进行 预测 ,获得 设备 的 健康 状态 和 剩余 寿 
命 ,常用 的 基本 方法 有 滤波 法 ,神经 网 络 、 贝 叶 斯 等 。 

文献 5 用 卡尔 曼 滤 波 器 来 跟踪 钢 带 固有 频率 ,给 定 了 固有 频率 的 失效 阔 值 ， 
从 而 提出 一 种 预测 钢 带 失效 时 间 和 剩余 有 效 寿命 的 有 效 模型 。 在 文献 中 中 ,行星 
上 的 载体 剩余 寿命 根据 粒子 滤波 的 原理 方法 进行 了 有 效 预测 ,同时 ,也 得 到 了 寿命 
预测 的 有 效 置 信 区 间 范 围 。 通 过 实验 分 析 ,结果 显 示 了 提出 的 方法 具有 针对 系统 
的 加 载 条 件 及 特征 变量 的 信 噪 比 的 鲁 棒 性 。 

文献 9 研究 了 两 类 方法 有 效 融合 预测 框架 :基于 物理 的 预测 方法 与 基于 经 验 
的 预测 方法 。 设 备 的 关键 参数 通过 基于 物理 的 预测 方法 确定 ,同时 ,潜在 的 设备 失 
效 机 制 被 获得 ,然后 对 失效 机 制 进行 有 效 排序 ,确定 设备 的 故障 模型 。 设 备 监测 变 
量 的 特征 通过 利用 基于 经 验 的 预测 方法 进行 提取 ,对 设备 的 健康 演化 及 参数 变化 
等 进行 有 效 预 测 。 文 献 中 将 基于 案例 及 基于 模型 这 两 种 推理 的 方法 做 了 比较 , 联 
合 这 两 种 方法 ,建立 了 一 种 进行 设备 故障 诊断 的 低 成 本 的 方法 。 

1. 基于 人 工 神 经 网 络 的 方法 

人 工 神 经 网 络 (ANN) 是 一 个 数据 处 理 系统 ,通常 是 由 输入 层 、 隐 藏 层 和 输出 
层 三 层 组 成 。 每 层 由 一 定数 量 的 、 结 构 简单 的 ,被 称 为 “节点 ”或 “神经 元 ”的 类 似 神 
经 元 的 处 理 单元 组 成 ,这 些 单元 通过 使 用 数字 化 的 权重 彼此 连接 来 互相 作用 "9。 
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根据 神经 网 络 的 拓扑 结构 和 信息 流 的 传递 方式 ,ANN 可 以 分 为 前 馈 网 .反馈 网 和 
混合 网 三 种 形式 。 

通过 网 络 的 训练 程序 ,可 以 在 ANN 一 系列 的 输出 和 输入 之 间 构 建 结 构 复杂 
的 回归 函数 。 常 见 的 训练 方法 有 两 种 :监督 学 习 和 无 监督 学 习 。 监 督学 习 通 过 一 
系列 特定 的 输出 和 输入 来 实现 网 络 的 训练 ,无 监督 学 习 的 用 途 主要 用 于 输入 数据 
的 分 类 5 。 通 过 网 络 训练 机 制 ,ANN 可 用 于 将 一 系列 的 网 络 输出 和 输入 之 间 的 
关系 构建 为 结构 复杂 的 回归 函数 。 

基于 ANN 的 方法 具有 提高 处 理 速度 .降低 系统 复杂 性 等 潜在 优势 ,因此 它 在 
预测 研究 领域 内 引起 了 普遍 的 关注 。 此 类 方法 及 衍生 模型 通过 提供 通用 性 强 且 可 
重复 利用 的 软件 及 硬件 组 件 ,在 建 模 和 辅助 决策 方面 (如 数据 分 类 ) 得 到 了 广泛 应 
H. ANN 并 不 依赖 于 先 验 法 则 或 概率 统计 模型 ,并且 能 够 非常 有 效 地 简化 模型 的 
集成 过 程 。 传 统 方法 很 难 适 用 于 解析 困难 的 问题 ,如 非 线性 ,高 阶 . 时 变动 态 系统 
等 ,但 是 ANN 可 以 很 容易 地 解决 这 类 问题 的 建 模 问 题 ,甚至 对 不 能 解析 的 问题 ， 
也 可 以 建立 对 应 的 ANN 模型 。 通 过 对 模型 的 调整 ,可 以 增加 错误 的 容许 量 ,并且 
在 系统 的 成 熟 中 自我 调整 ,对 结果 做 出 补偿 。 

ANN 及 其 衍生 模型 又 称 黑 盒子 。 一 方面 , 黑 盒子 保证 了 模型 容易 建立 ; 另 一 
方面 ,在 预测 结果 中 缺乏 原理 性 的 直接 分 析 。 虽 然 与 物理 模型 和 基于 知识 库 的 方 
法 相 比 ,建立 ANN 模型 相对 容易 ,但 对 系统 设计 者 来 说 ,在 实际 运用 中 ,将 领域 知 
识 用 到 人 工 神经 网 络 是 非常 困难 的 。 对 设计 者 来 说 ,预测 过 程 本 身 是 一 个 “ 黑 盒 
子 ”, 很 难 将 ANN 的 输出 和 物理 现象 联系 起 来 。 当 ANN 的 规模 增长 时 ,训练 会 变 
得 非常 复杂 。 举 例 来 说 ,如 何 设置 每 一 层 需要 的 处 理 节 点 数量 就 是 一 个 非常 令 人 
困扰 的 问题 "9 。 

ANN 在 预测 的 应 用 上 分 为 两 类 :一 类 用 作 非 线性 函数 的 拟 合 ,并 在 此 基础 上 
通过 数值 估计 和 数据 分 类 的 应 用 来 预测 系统 的 失效 特征 和 趋势 ; 另 一 类 和 系统 的 
反馈 连接 一 道 用 作 系 统 退 化 的 动态 过 程 建 模 ,并 计算 系统 有 效 剩 余 寿 命 的 预测 
199 , ANN 可 作 “ 预 测 器 ”, 把 时 间 序 列 的 历史 数据 映射 到 未 来 数据 ,也 可 把 
ANN 作为 “组 合 器 "555 ,给 出 常规 预报 方法 的 最 佳 组 合 。 由 于 ANN 具备 将 不 同 汇 
道 , 甚 至 分 离 的 渠道 中 的 数字 信息 融入 模型 的 能 力 , 因 此 一 个 设计 整合 良好 的 
ANN 模型 可 以 快速 精确 地 执行 在 线 模式 识别 任务 。 从 这 些 系统 中 所 提取 的 数据 
可 以 共同 用 作 设 备 故障 诊断 和 健康 状态 预测 。 与 传统 的 非 线性 组 合 预报 相 比 , 神 
经 网 络 组 合 预报 模型 在 提高 预报 精度 的 同时 无 须 对 模型 结构 作 限 制 ,优势 
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突出 [6 。 

文献 5 利用 ANN 模型 来 研究 轴承 故障 分 类 。Wang 56 AU938 ANN 模型 
来 解决 旋转 机 械 故 障 诊断 的 问题 。 文 献 " 中 探讨 了 ANN 模型 在 电子 机 械 中 的 故障 
诊断 问题 的 应 用 。 文 献 52 用 ANN 模型 进行 区 分 故障 类 型 对 于 提取 的 特征 数据 、 
环境 和 振动 变量 的 影响 。 文 献 59 提出 在 有 些 情 况 中 没有 办 法 以 特征 变量 的 空间 
来 定义 失效 ,但 却 能 依据 专家 知识 和 操作 经 验 定义 失效 。 因 此 ,在 这 种 情况 下 ,用 
前 馈 型 神经 网 络 对 特征 变量 进行 预测 ,用 Sugeno 模糊 推理 模型 对 失效 进行 定义 ， 
从 而 进行 设备 性 能 可 靠 度 的 预测 。 文 献 69 建立 了 两 类 基于 NN 的 寿命 有 效 预测 
方法 ,通过 案例 分 析 可 知 这 两 种 方法 可 以 获得 较 高 的 预测 精度 。 在 方法 框架 中 , 基 
于 设备 的 历史 监测 数据 ,多 个 前 馈 型 反 向 传播 的 神经 网 络 被 建立 ,从 而 轴承 服役 时 
间 被 有 效 估 计 , 用 一 个 振动 幅 值 阔 值 来 描述 轴承 失效 。Tran 和 YangU" 应 用 自 适 
应 神经 网 络 预测 设备 的 健康 状态 。Sou-Sen Leu 等 人 中 提出 了 神经 网 络 和 隐 马 尔 
可 夫 模 型 的 集成 模型 预测 设备 的 寿命 。 文 献 "*- 中 也 是 应 用 ANN 对 设备 的 健康 进 
行 预测 和 对 设备 的 有 效 剩余 进行 预测 的 。 

在 ANN 中 ,要 求人 工 神经 元 对 系统 的 输入 信号 进行 变换 ,该 变换 要 求 当 神 经 
元 所 获得 的 输入 信号 超过 累积 效果 阔 值 时 ,就 可 激发 该 神经 元 ,否则 就 抑制 该 神经 
元 , 即 人 工 神经 元 需要 一 个 变换 函数 ,用 来 执行 对 神经 元 所 获得 的 网 络 输入 进行 变 
换 , 该 变换 函数 称 为 激活 函数 。 常 用 的 激活 函数 有 线性 函数 , 非 线 性 斜面 函数 、 国 
值 函数 和 sigmoid 形 函 数 ""]。 小 波动 态 神 经 网 络 是 神经 网 络 的 衍生 模型 之 一 ,是 
小 波 分 析 理 论 与 人 工 神经 网 络 理论 完美 结合 的 产物 。 它 兼容 了 小 波 分 析 与 人 工 神 
经 网 络 的 优越 性 ,在 判别 和 分 类 问题 上 有 其 独到 之 处 。 它 既 能 够 充分 利用 小 波 变 
换 的 时 频 局 部 化 特性 ,又 可 以 充分 发 挥 人 工 神 经 网 络 的 自学 习 、 自 适应 能 力 , 从 而 
具有 较 强 的 逼近 与 容错 能 力 ,非常 适用 于 物理 信号 和 图 像 的 分 析 。 

一 些 学 者 提出 了 动态 小 波 神经 网 络 DWNN 系统 来 处 理 预 测 中 的 分 类 问题 。 
在 在 线 执行 和 应 用 前 ,需要 对 模型 进行 训练 和 验证 。DWNN 可 以 使 用 时 间 相 关 的 
训练 方法 ,如 以 Levenberg-Marquardt 算法 为 代表 的 梯度 下 降 技 术 ,也 可 以 使 用 一 
些 进 化 算法 ,如 遗传 算法 5 中 等 。DWNN 能 够 用 动态 模式 来 处 理 , 提 取 自 暂 态 序列 
并 保持 动态 的 特征 ,这 些 提 取 到 的 特征 可 以 和 描述 指定 时 间 片 段 下 过 程 的 时 间 相 
关 向 量 融 合 。 一 个 训练 良好 ,结合 了 有 效 剩余 寿命 计算 机 制 的 DWNN, 可 以 扮演 
在 线 预 测 操作 者 的 角色 。 它 的 缺点 是 需要 一 个 足够 大 的 数据 库 来 完成 特征 提取 、 
训练 、 验 证 和 优化 工作 。 
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文献 中 描述 了 基于 动态 小 波 神经 网 络 的 寿命 预测 方法 。 在 它 的 案例 分 析 中 ， 
验证 了 该 方法 的 可 行 性 ,轴承 的 振动 信号 功率 谱 密 度 被 用 作 模 型 的 输入 特征 变量 ， 
需要 假设 基于 功率 谱 密 度 的 失效 靖 值 在 剩余 的 预测 过 程 中 。Wang 和 Vachtseva- 
nos? f£ y. T —^4* DWNN 预测 框架 。 在 网 络 中 将 临时 信息 和 存储 能 力 纳入 功能 
性 中 ,可 以 执行 故障 的 预测 任务 。 模 型 的 预测 结构 基于 一 个 静态 “虚拟 传感器 ”, 该 
传感器 在 已 知 故障 数据 的 阔 值 范围 和 一 个 可 根据 故障 组 件 的 当前 状态 推测 未 来 时 
间 状 态 的 预报 器 间 建 立 连 接 , 并 据 此 揭示 故障 模式 随时 间 推 进 的 演化 过 程 , 预 测 组 
件 的 有 效 剩余 寿命 。 阅 值 范围 与 预报 器 的 构造 均 基于 DWNN 模型 ,起 着 映射 工具 
的 作用 。Gebraeel 和 Lawley' 中 在 退化 模型 的 基础 上 使 用 DWNN, 利 用 传感器 的 
状态 参数 来 计算 部 分 退化 组 件 的 有 效 剩余 寿命 分 布 ,并 可 实现 持续 更 新 。 通 过 使 
用 实时 的 传感器 数据 对 神经 网 络 进行 “监督 ?训练 可 以 获得 初始 的 预测 失效 时 间 。 
这 些 初始 值 被 用 来 构造 一 个 被 监控 组 件 的 先 验 失效 时 间 分 布 ,并 使 用 贝 叶 斯 理论 
对 先 验 分 布 进行 不 断 更 新 。 这 个 模型 的 独特 之 处 在 于 ,具有 根据 传感器 的 状态 信 
号 来 对 组 件 有 效 剩 余 寿命 分 布 进行 更 新 的 能 力 。 这 些 实时 的 传感器 信号 可 以 捕 提 
到 组 件 的 最 新 退化 状态 ,并 据 此 更 新 与 组 件 的 物理 退化 直接 相关 的 寿命 分 布 。 

多 项 式 在 描述 物理 过 程 和 动态 系统 时 表现 出 来 的 近似 普遍 性 先后 被 Kolmog- 
orov 于 19 世纪 40 年 代 ,Gabor 于 19 世纪 50 年 代 证 实 。 大 致 而 言 , 许 多 设计 中 的 
主要 元 素 可 以 通过 归纳 法 进行 建 模 。 虽 然 利 用 数学 原理 和 法 则 是 最 常用 的 方法 ， 
但 其 他 的 一 些 逻 辑 因 素 和 先 验 知识 模块 也 表现 不 俗 。 多 项 式 神经 网 络 PNN 利用 
T KG(CKolmogorov,Gabor) 多 项 式 和 数学 几何 [59 。 与 只 使 用 了 KG 函数 中 前 两 
项 的 多 层 神经 元 网 络 相 比 ,PNN 利用 了 高 阶 序列 和 交叉 耦合 的 非 线性 特点 。 文 
ERESHE PNN 来 分 析 直 升 机 传动 装置 中 的 正常 和 故障 振动 信号 ,该 模型 可 以 用 
作 一 般 性 故障 的 诊断 .隔离 和 评价 估计 。 文 献 中 的 数据 来 自 9 次 故障 播种 索 具 实 
验 , 每 个 实验 各 自 对 应 6 个 不 同 故 障 / 非 故障 状态 中 的 一 个 。 这 些 数 据 被 用 作 模 型 
的 训练 和 PNN 分 类 任务 完成 情况 的 评价 。 特 征 值 提 取 自 时 间 序 列 的 振动 信号 的 
光谱 幅 值 ,通过 使 用 MLPP(multiple-look post-processing) 策 略 使 振动 信号 的 分 类 
达到 最 优 。 

自 组 织 神经 网 络 SOM 通常 用 于 处 理 特征 空间 的 建立 和 系统 退化 诊断 问题 。 
网 络 模型 中 的 神经 元 列 阵 全 部 互相 连接 , 即 每 个 神经 都 接收 相同 的 外 部 输入 ,并 在 
外 部 输入 出 现时 ,同时 开始 工作 。 网 络 采 用 “ 胜 者 优先 ”的 学 习 机 制 , 即 选 出 的 一 个 
神经 元 网 络 训练 好 后 , 当 同 样 的 模式 出 现时 , 某 个 神经 元 将 兴奋 起 来 ,表示 该 神经 
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元 认识 这 个 模式 ,这 种 信息 处 理 模 式 源 于 人 脑 内 的 感觉 映射 。 在 对 输入 数据 进行 
标准 化 处 理 后 , 自 组 织 神经 网 络 可 以 进行 迭代 训练 轨 。 在 训练 的 每 一 步 ,每 个 样 
本 矢量 X 均 从 输入 数据 组 中 随机 选取 而 得 ,矢量 X 和 网 络 中 权重 矢量 的 距离 初始 
值 随 机 生成 ,并 使 用 某 种 距离 测量 方法 计算 ,如 欧 几 里 得 距离 。 最 靠近 X 的 权重 矢 
量 所 属 单位 即 是 映射 单位 ,又 被 称 为 最 匹配 单位 BMU (best matching unit) 。 当 确 
认 BMU 后 ,BMU 的 权重 矢量 和 它 的 拓扑 邻居 被 随 之 更 新 ,使 其 更 接近 输入 矢量 
X。 在 训练 程序 结束 时 ,权重 矢量 根据 它们 在 输入 空间 中 的 距离 而 分 类 聚拢 。 

SOM 具有 很 好 的 样本 聚 类 和 模式 识别 能 力 , 加 之 无 监督 的 自学 习 方 式 ,使 其 
在 机 械 故 障 模式 识别 和 故障 预测 中 获得 广泛 应 用 。 和 一 些 传统 方法 ,如 PCA 相 
LE. SOM 可 以 用 来 处 理 具 有 高 偏离 度 的 非 线 性 数据 。SOM 的 无 监督 学 习 特 性 不 
需要 事先 获得 和 输入 向 量 对 应 的 目标 值 ,因此 ,在 输入 数据 所 属 类 别 的 信息 未 知 的 
情况 下 , 它 仍 可 以 用 于 数据 分 类 工作 。SOM 是 揭示 状态 空间 结构 的 有 力 工 具 , 同 
时 , 它 能 有 效 地 将 系统 行为 可 视 化 ,是 系统 监测 和 系统 退化 诊断 的 有 力 工具 。 
文献 中 通过 使 用 6 个 振动 信号 数据 来 对 SOM 进行 训练 ,训练 后 输出 的 MQE 
(minimum quantization error) 指 标 来 评价 轴承 滚珠 的 退化 情况 ,并 预测 有 效 剩 余 
寿命 。 针 对 滚珠 从 初始 完好 状态 到 完全 失效 的 最 终 状 态 的 全 过 程 ,SOM 都 建立 了 
适当 的 退化 指标 。 

综 上 所 述 ,ANN 用 于 预测 领域 存在 如 下 优点 。 

(1) 作 为 “ 黑 盒子 "系统 ,不 需要 建立 基于 系统 物理 规律 的 数学 模型 , 建 模 容易 。 

(2) 更 好 的 容 噪 性 ,能 很 好 地 处 理 常 伴随 大 量 噪声 的 传感器 信号 5] 。 

(3) 优 秀 的 非 线 性 映射 能 力 ,能 以 给 定 的 任意 精度 逼近 任意 的 连续 函数 。 

总 之 ,以 上 特点 使 ANN 能 够 较 好 地 反映 机 械 设备 实际 工作 状态 的 发 展 趋势 
与 状态 信号 的 关系 。 同 时 ,ANN 能 进行 多 参数 .多 步 预报 ,在 故障 预测 方面 具有 很 
好 的 应 用 前 景 。 

2. 贝 叶 斯 网 络 方法 /模型 

工程 中 需要 进行 大 量 科学 .合理 的 推理 ,而 且 工 程 实际 问题 大 多 比较 复杂 ,其 
中 存在 的 大 量 不 确定 性 因素 给 准确 推理 带 来 了 困难 。 不 确定 性 推理 也 是 人 工 智能 
的 重要 研究 领域 ,尽管 许多 非 概率 模型 在 人 工 智能 的 领域 都 得 到 了 广泛 应 用 ,但 是 
研究 人 员 认 为 在 常识 推理 的 基础 上 构建 和 使 用 概率 方法 也 是 可 能 的 。 为 了 提高 推 
理 的 准确 性 ,Judea Pearl 于 1988 4E $ë ii T DL np Jr fd 2579. CBN, Bayesian net- 
work) ,用 于 处 理 人 工 智能 中 的 不 确定 性 信息 。BN 又 称 信 度 网 络 ,是 贝 叶 斯 方法 
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的 扩展 , 自 提出 后 便 成 了 研究 的 热点 ,是 目前 不 确定 知识 表达 和 推理 领域 最 有 效 的 
理论 模型 之 一 。 

BN 来 自 概率 论 和 图 论 的 综合 应 用 。 它 是 基于 概率 推理 的 图 形 化 网 络 ,而 贝 叶 
斯 公式 则 是 这 个 概率 网 络 的 基础 。BN 是 一 个 具有 概率 分 布 的 有 向 弧 段 (directed 
acyclic graph, DAG) , 它 由 节点 和 有 向 弧 段 组 成 。 节 点 代表 随机 变量 ,连接 节点 的 
有 向 弧 段 代 表 了 节点 间 的 互相 关系 (由 父 节 点 指向 其 后 代 节 点 ) 或 概率 关系 ,没有 
父 节点 的 节点 用 先 验 概率 表述 信息 。 节 点 变量 可 以 是 任何 问题 的 抽象 ,如 测试 值 、 
观测 现象 .意见 征询 等 。 适 用 于 表达 和 分 析 不 确定 性 与 概率 性 的 事件 ,应 用 于 有 条 
件 地 依赖 多 种 控制 因素 的 决策 ,可 以 从 不 完全 、 不 精确 或 不 确定 的 知识 或 信息 中 做 
出 推理 。 可 以 用 B(G,Pr) 来 描述 BN, 这 里 G 是 不 构成 回路 的 有 向 弧 段 , Pr 是 条 
件 概率 ,可 通过 递归 乘积 对 其 进行 分 解 " I。BN 是 为 了 解决 不 定性 和 不 完整 性 问 
题 而 提出 的 ,经 过 多 年 的 发 展 已 逐步 成 为 处 理 不 确定 性 信息 技术 的 主流 ,在 计算 机 
智能 科学 .工业 控制 .医疗 诊断 等 领域 的 许多 智能 化 系统 中 都 得 到 了 重要 应 用 。 在 
设备 维护 领域 ,BN 对 于 解决 复杂 设备 不 确定 性 和 关联 性 引起 的 故障 有 很 大 优势 ， 
成 为 众多 学 者 的 研究 对 象 。 

BN 的 建造 需要 知识 工程 师 和 领域 专家 的 共同 参与 ,在 实际 操作 时 可 能 需要 反 
复 交 叉 进行 使 用 与 不 断 完善 ,这 是 一 个 复杂 的 任务 。 面 向 设备 故障 诊断 和 预测 应 
用 的 BN 的 建造 所 需 的 信息 来 自 多 种 渠道 ,如 设备 手册 .生产 过 程 、 测 试 过 程 、 维 修 
资料 及 专家 经 验 等 。 首 先 将 设备 故障 分 为 各 个 相互 独立 且 完 全 包含 的 类 别 ( 各 种 
故障 类 别 至 少 应 该 具备 可 以 区 分 的 界限 ), 然 后 对 各 个 故障 类 别 分 别 建造 BN 模 
型 。 需 要 注意 的 是 ,诊断 模型 只 在 发 生 故 障 时 启动 ,因此 无 须 对 设备 正常 状态 建 
模 。 通 常设 备 故障 由 一 个 及 以 上 的 因素 造成 ,这 些 因 素 又 可 能 由 一 个 或 几 个 更 低 
层次 的 因素 造成 。 建 立 起 网 络 的 节点 关系 后 ,还 需要 进行 概率 估计 。 具 体 方法 是 
假设 在 某 故 障 因素 出 现 的 情况 下 ,估计 该 故障 因素 的 各 个 节点 的 条 件 概 率 ,这 种 局 
部 化 概率 估计 的 方法 可 以 大 大 提高 效率 5 。 

动态 贝 叶 斯 网 络 (Dynamic Bayesian network. DBN) 是 一 个 包含 了 统计 过 程 
的 有 向 图 模型 ,可 以 对 系统 在 时 间 进 程 上 进行 监控 和 更 新 ,并 进一步 预测 系统 未 
来 的 状态 。DBN 的 目的 是 在 随机 变量 的 半 无 限 样本 集中 建立 一 个 概率 分 布 模 
型 ,其 中 随机 变量 的 进程 与 一 些 事 件 模型 相对 应 。 在 一 个 BN 中 ,通常 需要 定义 
如 下 组 成 部 分 : 先 验 网 络 PCX ,转换 网 络 P(X,|X,-1) 和 观测 网 络 PCY, | X). 
先 验 网 络 表述 了 在 起 始 时 间 片 段 2 = 0 时 .BN 中 所 有 变量 的 先 验 概率 分 布 。 转 
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换 网 络 阐明 了 每 个 变量 在 每 个 时 间 片 段 :二 1,2,…,n 上 变化 的 概率 。 观 测 网 络 
说 明了 在 时 间 片 段 : 上 ,观测 节点 和 其 他 节点 间 的 关系 。DBN 中 的 每 个 变量 均 和 
时 间 片 段 相 关 , 记 为 X,。 模 型 中 有 两 个 关键 参数 :一 个 是 建 模 过 程 中 涉及 的 时 间 
跨度 了, 即 一 共有 工 个 时 间 片 段 ; 另 一 个 是 与 时 间 片 段 相 关 的 变量 X, ,其 个 数 为 ， 
称 为 样本 空间 n, 

Sheppard 和 Kaufman P Æ BN 的 基础 上 建立 了 一 个 设备 健康 诊断 模型 ,该 模 
型 中 包含 了 失效 概率 、 设 备 的 不 确定 性 和 故障 迹象 的 预测 等 信息 。 他 们 也 使 用 了 
DBN ,通过 对 整个 时 间 段 的 设备 状况 建 模 , 来 执行 预测 的 工作 。Przytula 和 
Choit (HJH T Dnt Ife RE I tA (BBN, Bayesian belief net) 作 为 预测 框架 ,对 系统 
的 预测 和 有 效 剩 余 寿命 的 估 值 都 可 以 在 此 框架 下 完成 。 在 Gebraeel 和 Lawley 等 
学 者 "中 设 计 的 预测 模型 中 ,使 用 BN 对 先 验 概率 分 布 进行 更 新 ,并 完成 对 后 续 失 效 
时 间 点 的 预测 工作 。Dong 和 Yang"* 1 设计 了 一 个 基于 DBN 的 预测 模型 ,可 以 用 
作 钻 头 零 件 有 效 剩余 寿命 的 预测 。 在 如 何 建 立 DBN 并 设计 相应 的 算法 方面 ,他 们 
提供 了 详细 的 说 明 步 又 ,采用 基于 部 分 过 滤 算 法 的 预测 过 程 估计 一 台 垂 直 钻 孔 机 
中 零件 的 有 效 剩余 寿命 。 文 献 ”” 中 以 贝 叶 斯 方法 进行 在 线 更 新 衰退 模型 的 参数 ， 
通过 联合 轴承 的 失效 阔 值 ,获得 寿命 分 布 的 封闭 形式 。 在 文献 5 吧 中 ,讨论 了 设备 
的 运行 环境 存在 时 变 情形 的 寿命 预测 。 文 献 " 中 讨论 了 同类 设备 的 历史 数据 中 的 
失效 时 间 的 数据 可 得 情形 的 寿命 预测 。 文 献 " 趾 对 设备 的 衰退 模型 随机 参数 没有 
呈现 正 态 分 布 的 情形 进行 了 讨论 ;设备 性 能 衰退 模型 随机 参数 在 符合 更 普遍 的 分 
布 形 式 时 ,对 寿命 预测 方法 进行 了 有 效 的 描述 。 文 献 " 中 用 多 项 式 的 模型 进行 外 推 
特征 变量 来 对 直升机 齿轮 箱 的 剩余 有 效 寿 命 进行 预测 。 

BN 用 条 件 概率 表达 各 个 信息 要 素 之 间 的 相关 关系 ,能 在 有 限 的 \ 不 完整 的 .不 
确定 的 信息 条 件 下 进行 学 习 和 推理 ,能 很 好 地 应 对 不 确定 性 问题 。 在 多 信息 源 存 
在 时 , 它 能 有 效 地 对 多 元 信息 进行 表达 与 融合 。 例 如 ,BN 可 将 故障 诊断 预测 与 维 
修 决策 相关 的 各 种 信息 纳入 网 络 结构 中 , 按 节 点 的 方式 统一 进行 处 理 , 能 有 效 地 按 
信息 的 相关 关系 进行 融合 。 但 是 贝 叶 斯 网 络 建 模 时 需要 大 量 的 故障 数据 ,包括 设 
备 受到 重大 损伤 时 的 数据 ,这 些 数 据 很 难 获 得 .或 虽 能 获得 但 成 本 高 昂 o 


2.3.4 基于 模型 驱动 的 方法 


基于 模型 驱动 的 设备 健康 预测 方法 ,这 类 方法 通常 认为 状态 监测 是 影响 设备 
健康 的 主要 因素 。 常 用 数学 模型 来 描述 设备 的 衰退 行为 ,进而 通过 数学 模型 预测 
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设备 健康 状态 和 剩余 寿命 。 常 用 的 方法 包括 隐 式 马尔 可 夫 模型 、 隐 式 半 马 尔 可 夫 
模型 .失效 模型 .GM 模型 等 。 

1. 隐 式 马尔 可 夫 模 型 和 隐 式 半 马 尔 可 夫 模 型 

隐 式 马尔 可 夫 模 型 HMM 是 随机 过 程 模型 的 一 种 , 它 能 够 描述 双重 内 杏 于 系 
统 底 层 且 不 可 见 的 随机 过 程 ,模型 名 称 中 的 “ 隐 ” 即 来 自 它 描述 不 可 见 过 程 的 能 力 。 
作为 一 个 参数 模型 , HMM 通过 对 大 量 的 实验 数据 进行 统计 分 析 , 得 到 参数 的 
估 值 。 

HMM 最 开始 广泛 使 用 于 模式 识别 的 研究 中 ,近年 来 也 被 引入 了 预测 分 析 的 
建 模 中 ,具有 其 他 一 些 传统 方法 所 不 具备 的 特质 。HMM 不 但 能 反映 出 设备 状态 
的 随机 性 ,同时 能 够 揭示 出 这 些 设备 的 隐藏 状态 和 状态 间 的 转换 过 程 。 进 一 步 而 
言 ,HMM 的 理论 基础 强健 ,构建 合理 ,并 且 算 法 易于 软件 的 实现 ,但 是 HMM 模型 
存在 较 多 约束 。 比 较 重要 的 一 点 是 ,连续 系统 的 行为 观测 必须 是 相互 独立 的 。 马 
尔 可 夫 链 本 身 的 一 条 重要 假设 是 在 时 间 节 点 : 上 ,给 定 状态 的 转移 概率 只 取决 于 
系统 在 时 间 节 点 :一 1 时 所 处 的 状态 。 而 且 , 模 型 中 的 状态 持续 时 间 遵 循 指数 分 
布 。 换 言 之 ,HMM 不 能 详细 准确 地 描述 模型 中 的 时 间 结 构 。 在 实际 应 用 中 ,这些 
限制 不 一 定 能 得 到 满足 ,并 因此 影响 模型 的 精确 度 。 

文献 9 中 构建 了 一 种 设备 故障 诊断 和 寿命 预测 的 综合 架构 一 一 基于 隐 马 尔 可 
夫 模 型 的 框架 。 得 出 预测 主要 服务 于 设备 健康 状态 发 生变 化 的 趋势 估计 ,但 是 , 文 
中 对 于 设备 出 现 故障 前 的 寿命 预测 没有 很 好 地 进行 讨论 。 文 献 5"5 发 展 了 轴承 失 
效 的 诊断 和 预测 的 联合 方法 ,主要 包括 主 成 分 分 析 法 (prcinciple component analy- 
sis,PCA) HMM 及 一 种 自 适 应 的 随机 寿命 预测 模型 。PCA 用 于 提取 监测 数据 的 
主要 特征 ,HMM 用 来 诊断 当前 轴承 的 状态 , 自 适应 的 随机 寿命 预测 模型 用 来 预测 
并 且 更 新 设备 健康 指标 发 展 趋势 ,从 而 进行 剩余 寿命 的 预测 。 文 献 B%:'29 也 用 
HMM 对 设备 进行 故障 诊断 和 寿命 预测 ,为 设备 运转 过 程 中 出 现 的 每 个 健康 状态 ， 
分 别 建立 HMM ,并 根据 传感器 的 检测 数据 ,对 健康 状态 的 转折 点 进行 估计 ,从 而 
估计 其 状态 转换 点 的 条 件 分 布 ,但 没有 详细 讨论 怎样 预测 设备 剩余 寿命 。 文 
iK C517 35400. HMM 看 为 动态 贝 叶 斯 网 络 执行 诊断 与 预测 ,能 直接 来 估计 设 
备 各 个 健康 状态 间 的 状态 转移 概率 ,采用 蒙特 卡 洛 仿真 方法 来 估计 设备 剩余 寿命 
和 置信 区 间 ,钻头 案例 验证 了 此 方法 的 有 效 性 。 文 献 2o9 同样 应 用 了 HMM 对 设 
备 执行 在 线 诊断 与 预测 。 

隐 式 半 马 尔 可 夫 模 型 HSMM 在 一 个 设计 完善 的 HMM 基础 上 添加 了 时 间 组 
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件 。 为 了 解决 HMM 不 能 清楚 描述 状态 持续 时 间 的 问题 ,一 些 学 者 ”3 提出 了 
HSMM ,可 以 对 状态 持续 时 间 的 概率 问题 进行 清晰 描述 。 一 个 常见 的 设计 是 挑选 
与 实际 运用 中 真实 寿命 概率 方程 接近 的 概率 函数 来 代替 状态 持续 时 间 的 概率 密度 
函数 。 从 本 质 上 而 言 ,HSMM 是 在 HMM 的 基础 上 添加 了 一 个 描述 清晰 的 状态 持 
续 时 间 概 率 函 数 ,但 是 添加 函数 后 的 模型 不 再 遵循 严格 的 马尔 可 夫 过 程 。HSMM 
和 HMM 类 似 , 不 同 的 是 ,每 个 状态 不 只 对 应 一 个 观测 值 ,而 是 可 以 对 应 一 系列 的 
观测 值 ,这 些 对 应 于 停留 在 状态 时 的 所 有 观测 值 在 建 模 中 被 看 作 一 个 整体 。 隐 
式 半 马 尔 可 夫 链 在 确定 复杂 概率 分 布 问题 和 时 间 结 构 表 达 问 题 上 均 具 有 很 强 的 柔 
HE. SCHR EEE UH-60A 型 黑 鹰 直 升 机 中 的 主要 行星 传动 系统 建立 了 一 个 故障 
分 类 模型 。 

文献 92"! 习 论述 了 传统 HMM 的 局 限 性 ,表明 了 HMM 主要 用 指数 分 布 来 表 
示 每 个 健康 状态 的 持续 时 间 ,与 设备 的 实际 演化 情况 相 违 背 , 所 以 ,每 个 健康 状态 
的 持续 时 间 需 要 被 明确 地 描述 ,在 此 基础 上 ,提出 了 HSMM。 通 过 案例 说 明了 
HSMM 具有 更 好 的 有 效 性 和 状态 的 识别 性 。 文 献上 5 进一步 研究 了 状态 持续 长 度 
和 设备 的 老化 相关 的 情形 ,并 且 , 老 化 因子 被 引入 HSMM 中 , 借 此 来 描述 设备 在 
不 同 的 时 间 点 ,每 个 健康 状态 的 持续 时 间 分 布 。 在 案例 分 析 中 ,设备 在 将 近 发 生 故 
障 时 ,构建 的 方法 可 以 更 精确 地 预测 水 泵 剩余 寿命 。 

文献 25 表明 许多 设备 的 失效 过 程 包括 稳 态 过 程 与 非 稳 态 过 程 ,在 设备 正常 
运行 的 阶段 ,主要 是 稳 态 过 程 。 从 设备 出 现 故障 到 设备 最 终 失 效 的 阶段 ,主要 对 
应 的 是 非 稳 态 过 程 。 对 稳 态 过 程 来 说 ,主要 通过 可 靠 性 数据 来 执行 寿命 预测 。 
当 设 备 过 渡 到 非 稳 态 过 程 时 ,对 于 设备 的 传感器 检测 数据 ,假设 呈现 指数 增长 ， 
利用 设备 的 检测 数据 来 进行 设备 的 寿命 预测 。 在 文献 中 中 ,采取 了 Logistic Fl 
归 方 法 ,建立 设备 特征 变量 和 失效 概率 间 的 联系 ,采取 时 间 序 列 模型 用 来 进行 特 
征 变量 预测 ;利用 Logistic 模型 ,前 期 的 预测 值 作为 模型 输入 ,设备 的 剩余 寿命 的 
有 效 预测 被 执行 。Wu 等 人 提出 了 联合 小 波 变换 的 HSMM 进行 设备 的 故障 预 
WE, SE HSMM 的 寿命 预测 模型 很 好 地 描述 了 设备 当前 状态 (劣化 程度 ) 与 
监测 信息 之 间 的 概率 函数 关系 ,并 且 它 仅 用 当前 信息 估计 下 一 个 时 间 点 状态 。 但 
是 ,由 于 计算 复杂 度 问题 及 多 源 信 息 融 合 问题 ,HSMM 无 法 有 效 地 进行 在 线 健康 
预测 。 

另外 ,多 伦 多 大 学 MAKIS 教授 团队 也 做 了 一 些 这 方面 的 工作 , Tang 和 
MAKIS 等 人 基于 HMM 模型 ,考虑 了 带 有 部 分 故障 观测 数据 系统 的 参数 估 
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PEEP ,但 是 他 们 仅 假设 逗留 时 间 服 从 指数 分 布 ,没有 有 效 地 考虑 状态 的 逗留 
时 间 。 

2. 失效 率 和 比例 强度 模型 

失效 率 是 指 工作 到 某 一 时 刻 尚未 失效 的 设备 ,在 该 时 刻 后 ,单位 时 间 内 发 生 失 
效 的 概率 ,一 般 记 为 和 , 它 也 是 时 间 4 的 函数 , 故 也 记 为 4 (7) , 称 为 失效 率 函 数 , 有 时 
也 称 为 故障 率 函数 或 风险 函数 中]。 失 效率 作为 设备 寿命 分 析 中 的 一 个 重要 指标 ， 
它 的 数学 特质 能 揭示 出 数据 中 多 种 不 同 的 特征 ,被 广泛 应 用 于 设备 有 效 剩余 寿命 
的 预测 中 9 。 

文献 中 设计 了 名 为 GAMMA 的 随机 过 程 ,通过 用 失效 率 求 得 均值 来 预测 轴 
承 上 旋 转 组 件 的 有 效 剩余 寿命 。 通 过 对 振动 信号 的 分 析 , 专 家 用 状态 信息 作为 判 
断 的 依据 。 文 献 中 I 对 失效 率 服从 Birnbaum-Saunders 分 布 的 系统 进行 了 寿命 
分 析 。 

但 是 ,系统 或 零 部 件 的 失效 率 不 仅 受 操作 时 间 长 短 的 影响 ,还 受 操作 环境 下 的 
各 种 环境 参数 和 操作 参数 的 影响 ,如 气温 .湿度 .工作 负载 等 。 比 较 常见 的 一 个 问 
题 是 ,在 可 靠 性 数据 的 分 析 中 ,并 不 是 所 有 的 数据 都 在 同样 的 工作 状况 下 收集 获 
得 。 针 对 那些 有 效 剩余 寿命 受 参 数 影响 严重 的 系统 ,部 分 失效 率 模型 被 引入 了 预 
测 分 析 中 2 。 这 类 模型 一 开始 被 广泛 应 用 于 生物 医学 领域 ,近来 ,研究 可 靠 性 维 
护 管理 的 学 者 才 日 渐 对 它 产 生 了 浓厚 的 兴趣 。 在 可 靠 性 数据 的 分 析 中 ,一 个 经 常 
出 现 的 问题 是 并 非 所 有 的 数据 都 在 同样 的 工作 状况 下 收集 获得 ,部 分 失效 率 模型 
将 情景 概念 引入 失效 率 方程 中 。 人 情景 对 失效 率 的 影响 可 以 使 观测 到 的 失效 率 比 基 
准 失效 率 更 高 (例如 , 当 设 备 在 恶劣 状况 下 运行 时 ) ,也 有 可 能 使 失效 率 观测 值 低 于 
基准 值 ( 例 如 , 当 设备 的 运行 状况 得 到 改善 时 ) 。 部 分 失效 率 允 许 更 多 类 型 的 数据 
挖掘 风险 模型 来 描述 情景 对 设备 健康 状态 的 影响 

文献 2 使 用 部 分 失效 率 概念 建立 了 一 个 可 以 对 复杂 多 组 件 系统 进行 可 靠 性 
评估 和 风险 预测 的 模型 框架 。 该 模型 修改 了 部 分 失效 率 公式 ,使 其 可 以 适用 于 时 
间 变 化 的 随机 情境 ,将 任意 时 间 下 非 静态 随机 环境 中 的 离散 数据 组 进行 转换 ,并 在 
非 线性 网 络 环境 下 执行 。 失 效率 的 基准 值 来 自 一 个 参数 化 的 可 靠 性 模型 ,此 模型 
使 用 经 验 值 来 评估 可 靠 性 。 文 献 避 3 为 独立 的 旋转 机 械 组 件 建立 了 一 个 部 分 失效 
率 模型 ,该 模型 考虑 了 多 个 退化 特征 ,在 获得 实时 退化 信息 的 基础 上 ,预测 组 件 有 
效 剩 余 寿命 的 均值 。 文 献 C 呈 中 设计 了 一 个 提取 常见 失效 信号 的 算法 , 设 定 失效 特 
征 编码 为 取决 于 时 间 的 情景 变量 ,并 使 它们 互相 作用 。 文 献 中 的 Cox 失效 率 模型 





be 
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可 以 有 效 处 理事 件 序列 的 情景 ,序列 中 的 大 量 事件 类 型 都 基于 前 述 的 常见 失效 特 
征 。 此 模型 可 以 对 设备 故障 的 发 生 做 出 预警 ,为 设备 真实 失效 事件 的 发 生 预 留 出 
充分 的 准备 时 间 ,帮助 预防 性 维护 计划 的 制订 。 

文献 22 采取 比例 强度 模型 进行 设备 寿命 的 预测 ,并 以 此 来 评价 PM 的 效 
果 。 在 文献 中 中 ,比例 风险 模型 (proportional hazards model, PHM) 被 用 来 对 设 
备 可 靠 性 及 剩余 寿命 进行 预测 , 且 用 Markov 过 程 来 描述 设备 内 部 和 外 部 的 协 变 
量 发 展 过 程 ,因此 ,在 某 一 个 时 刻 预 测 协 变量 的 未 来 发 展 趋势 ,可 结合 比例 风险 模 
型 来 预测 设备 剩余 寿命 。 文 献 C5 划 分 了 水 和 泵 的 维护 方式 等 级 ,并 且 假设 水 泵 的 轴 
承 的 寿命 分 布 与 造纸 机 的 轴承 具有 一 样 的 形状 函数 与 不 同 的 尺度 函数 ,在 此 基础 
上 ,计算 水 泵 轴承 的 风险 函数 值 ,预测 寿命 。 

3. 灰色 模型 GMCI. D 

部 分 信息 已 知 .部 分 信息 未 知 的 系统 称 为 灰色 系统 。 由 于 相关 信息 不 充分 .从 
完整 ,不 确定 的 系统 大 量 存在 ,使 得 灰色 系统 在 各 个 领域 得 到 了 广泛 应 用 一 一 曾 被 
成 功 地 运用 于 管理 、 经 济 、 金 融和 工程 中 "2 。 即 使 在 数据 不 完全 时 ,灰色 模型 也 能 
有 效 地 对 系统 分 析 、 建 模 , 并 做 出 预测 。 在 灰色 系统 中 ,信息 和 原理 既 不 像 在 白色 
系统 中 那样 完全 清晰 ,也 不 像 在 黑色 系统 中 那样 完全 未 知 。 灰 色 系 统 将 每 个 随机 
变量 设置 为 灰色 量 , 使 之 在 一 定 范围 内 变化 。 它 可 以 直接 处 理 原始 数据 并 对 数据 
的 本 质 规律 进行 研究 。 灰 色 预 测 模型 可 以 应 用 于 数据 量 较 少 的 情况 中 ,同时 可 以 
在 Matlab 系统 下 轻松 实现 。 目 前 ,关于 GM(1,1) 的 研究 主要 集中 在 两 个 方面 : 
巴 加 强 对 原始 序列 的 处 理 , 例 如 进行 变换 处 理 以 增加 原始 离散 数据 的 光滑 度 ;@ 改 
iE GM(1,1) 模 型 ,使 其 具有 更 好 的 拟 合 优 庆 和 预测 精度 9 。 

影响 机 械 设备 工作 状况 的 因素 很 多 ,其 中 既 有 确定 性 因素 ,又 有 非 确 定性 因 
素 , 即 “灰色 ”因素 。 因 此 ,灰色 模型 适用 于 机 械 故 障 预测 。Huang" 引 将 灰色 预测 
模型 应 用 到 了 制造 过 程 的 监控 管理 中 。 当 平均 偏离 发 生 时 ,灰色 预测 器 能 够 监督 
样本 均值 ,尤其 是 在 子 集 成 员 数 量 较 少 时 。 可 见 , 灰 色 预 测 器 对 子 集 的 成 员 数 量 非 
常 敏感 。 也 有 学 者 将 灰色 模型 和 模糊 模型 组 合 0 ,探索 了 灰色 模型 在 设备 预测 领 
域 使 用 的 可 能 性 ,拓展 了 灰色 模型 GM(1,1) 的 适用 范围 。 文 献 C2 将 具有 差分 形 
式 的 灰色 模型 GM(1,1) 扩 展 为 GM(1,1,w) 预 测 模型 ,用 模糊 贴近 度 来 优化 参数 
w, 再 进行 故障 预测 ,工程 实例 证 实 了 此 方法 的 拟 合 优 度 和 预测 精度 均 高 于 未 优化 
的 GM(1,1) ,在 样本 空间 较 小 的 情况 下 能 得 到 更 好 的 预测 结果 。Gu poU E 
试 使 用 灰色 预测 模型 来 预测 电子 仪器 的 失效 时 间 ,但 其 工作 还 处 于 探索 阶段 。 
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2.3.5 基于 信息 融合 的 方法 


目前 , 随 着 计算 机 技术 的 迅速 发 展 , 多 传感器 的 技术 也 得 到 了 越 来 越 多 的 关 
注 。 多 传感器 的 融合 技术 利用 了 计算 机 的 智能 与 快速 的 运算 能 力 ,消除 了 数据 信 
息 间 的 差异 ,有 利于 数据 处 理 质 量 的 提高 。 多 传感器 信息 融合 技术 是 计算 机 科学 、 
数学 .智能 算法 及 管理 领域 等 多 学 科 的 综合 交叉 应 用 。 随 着 设备 复杂 性 的 提高 ,对 
设备 的 性 能 要 求 也 在 逐步 增加 ,因此 ,对 传感器 的 数量 和 种 类 要 求 也 在 增加 。 它 表 
示 了 在 面 对 同 一 检测 对 象 时 ,各 种 传感器 的 监测 信息 及 监测 信息 的 处 理 方法 被 综 
合 应 用 ,从 而 获得 设备 的 全 面 监测 信息 。 同 时 ,设备 监测 信息 的 精度 和 可 靠 性 得 到 
了 极 大 的 提高 。 来 自 多 传感器 的 监测 信息 ,具有 多 样 性 、 复 杂 性 ,信息 容量 大 的 特 
性 。 信 息 的 处 理 , 不 同 于 单个 传感器 信息 的 处 理 , 因 而 ,这 类 技术 的 研究 变 得 非常 

在 设备 故障 诊断 和 寿命 预测 中 ,考虑 多 传感器 的 融合 技术 主要 有 以 下 三 个 
原因 。 

(1) 在 故障 诊断 和 寿命 预测 复杂 化 的 情况 下 ,对 传感器 种 类 和 数量 的 要 求 也 
在 增加 ,对 于 设备 的 不 同 部 位 ,可 以 利用 不 同 的 传感器 获得 不 同类 型 的 信息 。 相 较 
于 单个 传感器 的 只 能 获得 单一 信息 的 情形 ,多 传感器 可 以 获得 多 样 的 状态 监测 信 
息 。 在 单一 信息 的 情形 下 ,进行 设备 故障 诊断 和 寿命 预测 的 精确 度 不 是 很 好 ,而 利 
用 多 样 化 ,不 同类 型 的 监测 信息 ,可 获得 可 靠 的 设备 诊断 和 寿命 预测 结果 。 

(2) 设备 故障 的 发 生 与 诊断 是 一 个 非常 复杂 的 过 程 , 相 同情 形 的 信息 可 以 反 
映 不 同 的 故障 类 型 。 比 如 ,机 械 转 子 的 振动 异常 故障 可 以 由 轴承 座 发 生 松动 .轴承 
发 生 不 对 中 .不 平衡 等 原因 引起 。 所 以 ,在 对 机 械 转 子 进行 振动 检测 时 ,就 包含 了 
大 量 的 关于 机 械 转子 的 状态 特征 信息 ,充分 应 用 转子 的 这 类 特征 信息 ,可 以 获得 更 
准确 的 转子 故障 类 型 。 

(3) 在 设备 的 故障 诊断 和 寿命 预测 过 程 中 ,因为 传感器 的 监测 信息 误差 .设备 
运转 过 程 中 的 噪声 及 设备 使 用 过 程 中 的 不 确定 性 等 ,对 传感器 的 监测 数据 质量 造 
成 很 大 的 影响 ,会 产生 不 完整 .不 准确 及 模糊 的 监测 数据 ,具有 监测 的 不 确定 性 。 

基于 信息 融合 的 设备 健康 预测 ,主要 有 三 类 方法 :第 一 类 方法 就 是 将 获得 的 
多 监测 数据 直接 作为 状态 空间 模型 的 输入 ,没有 经 过 任何 的 处 理 0% 325 , 文 
献 65 建 立 了 一 个 状态 空间 模型 ,将 检测 数据 作为 多 维 时 间 序 列 用 于 模型 的 输 
入 ,预测 设备 的 健康 状态 ,以 及 每 个 健康 状态 的 均值 和 方差 。 文 献 55 应 用 传 感 
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器 的 信号 描述 状态 空间 模型 中 隐藏 的 设备 健康 ,预测 设备 的 剩余 寿命 。 第 二 类 
方法 将 对 多 传感器 进行 数据 层次 的 融合 2 2 ,文献 中 利用 PCA 变换 多 传 感 
器 的 信号 ,形成 具有 较 低 维 数 的 数据 集合 ,应 用 随机 滤波 方法 预测 航空 发 动机 的 
设备 健康 和 剩余 寿命 。 文 献 P23 应 用 PCA 对 数据 进行 处 理 , 在 获得 较 低 维 数 的 
数据 集合 后 ,通过 神经 网 络 和 小 波 变 换 对 设备 进行 寿命 预测 与 健康 预测 。 第 三 
类 方法 将 对 多 传感器 进行 预测 层次 的 融合 02 2 ,文献 2 首先 建立 了 基于 每 个 
传感器 检测 信息 的 HSMM 诊断 和 预测 模型 ,其 次 通过 用 F-test 调整 每 个 传感器 
的 融合 权重 ,建立 多 传感器 的 HSMM 诊断 和 预测 模型 ,对 设备 进行 健康 诊断 和 寿 
命 预 测 。 文 献 中 应 用 随机 滤波 方法 和 利用 每 个 传感器 的 检测 信号 ,分 别 对 设备 进 
行 剩 余 寿命 预测 和 健康 状态 诊断 ,最 后 ,对 每 个 预测 结果 利用 线性 权重 策略 进行 有 
效 融合 。Wei 等 人 DO 考虑 了 对 一 类 潜在 退化 的 多 传感器 动态 系统 剩余 寿命 进行 
预测 。 基 于 多 个 传感器 的 监测 数据 ,采用 分 布 式 融 合 滤波 递归 识别 隐藏 的 衰退 过 
程 。 然 后 ,基于 拟 合 的 衰退 状态 和 更 新 操作 过 程 中 的 参数 ,预测 设备 的 剩余 使 用 寿 
命 。 不 确定 性 指标 用 来 定量 地 评价 增加 的 多 传感器 信息 预测 设备 剩余 使 用 寿命 的 
有 效 性 ,并 对 主要 结果 进行 了 验证 和 实际 案例 研究 El-Koujoka 等 人 0 研究 了 一 
个 非 线性 过 程 的 多 传感器 故障 检测 和 隔离 (MSFDI) 算 法 的 设计 与 开发 问题 。 所 提 
出 的 方法 基于 一 个 不 断 演进 的 multi-Takagi Sugeno 模型 框架 ,每 个 传感器 的 输出 
都 可 用 一 个 来 自 可 用 输入 /输出 的 测量 数据 模型 进行 估计 ,提出 的 MSFDI 算法 被 
应 用 于 连续 流 搅拌 反应 釜 。 仿 真 结果 表明 MSFDI 算法 的 有 效 性 。 预 测 的 主要 技 
术 如 表 2-1 所 示 。 


2.3.6 混合 模型 


设备 在 故障 发 展 过程 中 包含 了 多 种 趋势 ,其 中 既 有 确定 性 趋势 ,也 有 随机 性 趋 
势 ,设备 处 于 早期 的 轻微 故障 时 这 种 现象 表现 得 尤为 明显 。 因 此 ,在 实际 应 用 的 预 
测 过 程 中 ,各 种 特征 参数 的 趋势 是 多 样 化 的 ,单一 预测 方法 的 使 用 很 难得 到 准确 的 
预测 结果 。 为 提高 预测 的 准确 度 ,应 综合 应 用 多 种 预测 模型 。 一 个 设计 得 当 的 基 
于 状态 的 组 合 预测 模型 可 以 将 两 种 甚至 更 多 预测 方法 融入 模型 ,此 类 组 合 模型 在 
数据 提取 数据 分 析 和 建 模 上 有 如 下 的 优势 :单一 预测 理论 的 缺点 可 以 得 到 相互 
弥补 而 削弱 或 抵消 ,而 各 自 的 优点 却 可 以 得 到 充分 的 利用 ;@ 计 算 复杂 度 可 以 得 到 
有 效 降低 ,减少 程序 的 运行 时 间 ;@ 可 以 提高 预测 结果 的 准确 度 。 

针对 传统 的 非 线性 组 合 预测 模型 存在 的 不 足 ,ANN 被 作为 “组 合 器 ?引入 组 合 
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预测 模型 。 许 多 研究 将 神经 网 络 和 其 他 的 一 些 数据 处 理 方法 ,如 专家 系统 、 模 糊 逻 
辑 ` 灰色 系统 GM(1,1) 等 ,结合 起 来 建 模 。Brotherton[ 将 规则 提取 技术 应 用 到 
DL-EBF (dynamically linked ellipsoidal basis function) 神 经 网 络 中 ,并 用 此 模型 对 
涡轮 机 引擎 的 状态 进行 了 预测。 文献 将 机 械 数 据 用 推理 规则 转化 为 清晰 的 领域 
知识 并 集成 到 前 馈 神 经 网 络 中 ,利用 完成 训练 后 的 模型 预测 齿轮 箱 的 健康 状态 。 
在 此 模糊 神经 网 络 组 合 模型 中 ,神经 网 络 中 的 学 习 机 制 和 模糊 推理 系统 中 经 典 的 
语言 描述 都 得 到 了 运用 ,模糊 推理 系统 和 神经 网 络 进行 了 有 机 结合 。 以 上 的 这 些 
组 合 模型 的 建 模 原理 都 清晰 易 懂 , 具 有 显著 的 适应 性 、 鲁 棒 性 和 很 好 的 柔性 。 




















表 2-1 预测 的 主要 技术 
类 别 方法 支持 技术 ”| ”应 用 领域 优点 缺点 
m ok. he. 当 工 作 状况 发 
— 残 差 值 评估 , 参 | 回转 轴 、 飞 机 | 生 改变 时 ,不 用 | 模型 通用 性 
UT Damage OBAR | 发 动机 .瓦斯 重新 搜集 大 量 | 差 , 建 模 朵 难 
i 涡轮 压缩 机 | 数据 训练 模型 
可 以 处 理 不 准 
模糊 集 , 模糊 | 核 能 ， 制 造 | 确 \ 不 清 听 和 不 | 权重 参数 的 确 
LLL En s ATE EA t 
以 进行 连续 的 | 定 是 难点 
基于 知识 数学 建 模 
TAUSE 能 源 转化 处 领域 知识 难以 
amna |m pma |E E a | 和 得 ,同时 闪 
专家 系统 | 式 规则 , EH, va, | 的 思考 过 程 来 i t 
is 系统 制造 | 外头 可 于 将 领域 知识 
系统 转化 为 规则 
难以 将 领域 知 
轴承 .齿轮 箱 、| 适用 于 解析 困 Seen 
ANN BP.DWNN. 能 源 系 统 、 飞 | 难 的 模型 ,可 以 变 后 需要 搜集 
PNN.SOM 机 发 动机 、 齿 | UE ME m te | 
基于 数据 itf 线 模式 识别 | 大 量 数据 重新 
驱动 的 方法 "ee 训练 模型 ; 黑 全 
子 系统 
理论 基础 监视 ， | 需要 天 量 历史 
贝 叶 斯 网 络 es 容易 实现 对 未 | 数据 ,特别 是 
$ 来 状态 的 预测 | 失效 数据 
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续 表 
类别 | 方法 “| 支持 技术 | ”应 用 领域 优点 缺点 
HMM 的 前 提 在 
ix 实际 应 用 中 不 太 
状态 空间 HMM. NUES CUL | I URL | 实用 , HSMM ak 
模型 SHMM 统 、 钻 孔 系 统 易于 编程 实现 > HMM 中 的 
限制 ,但 是 相对 比 
x T 较 复 杂 
"RM 通用 性 强 ,模型 | 因为 “修复 如 新 ” 
分 失效 率 rea PER 不 需要 做 太 多 | 维护 理论 ,应 用 受 
模型 s 前 提 假 设 到 限制 
mn 处 理 不 完全 信 | 新 引入 设备 健康 
灰色 模型 | GMA.D 2 co Bo dH Ie 处 | 预测 领域 ,需要 更 
时 间 序列 数据 “| 多 的 实践 应 用 

















JC RC? 比较 了 应 用 循环 神经 网 络 的 系统 和 应 用 模糊 神经 网 络 的 系统 ,对 两 个 
系统 各 自 输 出 的 故障 传播 趋势 预测 结果 进行 了 比较 。 通 过 比较 ,发 现在 训练 良好 
的 情况 下 ,模糊 神经 网 络 系统 在 预测 的 精度 和 训练 的 有 效 性 方面 均 优 于 仅 使 用 神 
经 网 络 的 系统 ,模糊 概念 的 引入 提高 了 系统 的 性 能 。Chinnam 和 Baruahts5 也 使 用 
了 模糊 神经 网 络 模 型 来 预测 有 效 剩余 寿命 ,该 模型 在 不 能 获得 失效 数据 和 对 特定 
的 失效 模式 缺乏 定义 时 ,可 使 用 来 自 领域 专家 的 有 效 经 验 知识 来 估算 设备 的 有 效 
PRAM. Satish 和 Sarmal 将 模糊 逻辑 理论 融入 反 向 传播 神经 网 络 中 ,对 轴承 
状态 建 模 , 用 于 判断 发 动机 当前 状态 和 预测 有 效 剩 余 寿命 。 文 献 避 9 将 模糊 数学 模 
型 和 RBF(radial basis function) 神 经 网 络 模型 结合 ,用 来 预测 烧 煤 锅炉 潜在 的 故 
障 。Kothamasu 和 Huang04 设计 的 设备 诊断 预测 模糊 神经 网 络 模型 建立 在 
Mamdani 模糊 学 习 模型 的 基础 上 。 这 个 清晰 度 高 、 鲁 棒 性 强 的 建 模 系 统 作为 辅助 
决策 的 角色 ,很 好 地 服务 于 CBM 过 程 中 。 该 系统 着 重 强调 了 自身 的 清晰 性 和 易 解 
性 ,因此 它 能 够 作为 辅助 决策 有 效 地 服务 于 领域 专家 ,并 且 当 一 些 常见 的 变动 发 生 
时 ,可 以 很 容易 地 对 系统 进行 相应 的 修改 ,甚至 通过 与 用 户 的 互动 实现 持续 的 更 新 
和 升级 。 当 系统 中 的 规则 改变 时 ,模糊 神经 网 络 系统 的 易 理 解 度 通常 会 降低 ， 
Kullback-Leibler 信息 法 则 被 引入 系统 中 来 解决 这 个 问题 。 该 法 则 可 以 评价 并 规 
范 改变 后 的 规则 ,使 系统 更 容易 解释 和 理解 。 

灰色 模型 GM(1,1) 非 常 擅长 处 理 时 间 序 列 相关 的 问题 "外 ,而 人 工 神经 网 络 
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和 大 多 数 别 的 方法 则 具有 更 强 的 非 线性 时 间 序 列 的 处 理 能 力 。 文 献 和 将 灰色 模 
型 GM(1,1) 和 反 向 传播 神经 网 络 结合 ,设计 了 一 个 基于 多 状态 参数 的 模型 来 预测 
发 电站 中 设备 的 健康 状态 。 通 过 充分 利用 操作 数据 ,对 数据 进行 提取 分 析 后 ,能 够 
使 用 状态 监控 数据 和 统计 操作 数据 预测 设备 的 健康 状态 。 与 使 用 单 特 征 参 数 的 预 
测 模 型 所 输出 结果 相 比 ,该 组 合 模型 的 结果 更 具 合 理性 。 

还 有 其 他 一 些 混合 模型 也 被 用 于 设备 健康 状态 预测 领域 。 文 献 " 中 为 飞机 辅 
ere det mA ye 该 模型 对 系统 在 未 来 时 间 内 将 会 
持续 经 历 的 健康 状态 做 出 了 完整 的 预测 。 这 个 多 变量 状态 空间 模型 包括 一 个 年 龄 
ee eae li 
坏 等 离散 性 事件 对 系统 造成 的 影响 。Mohantym" 外 为 飞机 中 的 金属 架构 组 件 设计 
了 一 个 可 进行 实时 的 有 效 剩余 寿命 预测 的 组 合 模型 。 该 预测 模型 的 结构 包括 了 离 
线 的 物理 基础 信息 ` 离 线 的 数据 挖掘 模式 和 在 线 的 系统 判别 三 部 分 。 在 离线 预测 
部 分 ,模型 输入 空间 的 训练 数据 采用 对 疲劳 裂缝 成 长 造成 影响 的 参数 。 当 进行 在 
线 预测 时 ,输入 空间 的 训练 数据 选取 的 特征 值 提取 自 压 电 传感器 信号 ,而 没有 采用 
在 实际 飞行 条 件 下 很 难 测量 的 负载 参数 。 训 练 完成 的 高 斯 过 程 模型 的 输出 空间 ， 
包含 了 对 相应 的 未 知 裂缝 的 长 度 和 损害 状态 的 预测 。 

另外 ,Zhao 等 人 9 中 提 出 了 用 随机 组 合 方法 进行 高 效 的 齿轮 健康 预测 。 基 于 
广义 多 项 式 , 这 种 方法 被 用 来 评估 齿轮 剩余 使 用 寿命 预测 及 贝 叶 斯 推理 的 似 然 醒 
数 的 不 确定 性 。 收 集 的 状态 监测 数据 被 集成 到 预测 模型 中 ,通过 贝 叶 斯 推理 出 更 
新 的 在 给 定 的 检验 时 间 的 不 确定 性 的 分 布 。 与 传统 的 模拟 方法 相 比 ,所 提出 的 方 
法 是 更 有 效 的 ,并 且 能 够 处 理 高 维 概率 空间 。 可 用 实际 算 例 来 证 明 所 提出 的 方法 
的 有 效 性 。 文 献 C5 首先 介绍 了 在 线 时 间 序 列 预测 模型 的 预测 应 用 。 根 据 采集 到 
的 大 量 操作 数据 经 营 采样 数据 ,可 以 预测 系统 状态 的 未 来 发 展 趋势 和 可 能 的 系统 
故障 。 本 研究 提出 一 种 新 的 方法 ,包括 五 个 改进 的 在 线 支持 向 量 机 ,实现 自 适应 的 
在 线 状 态 监 测 与 故障 预测 。 文 献 9 叶 首先 设计 了 一 个 退化 失效 的 模式 判别 模型 ,应 
用 此 模型 联合 一 类 支持 向 量 机 算法 获得 非 线性 自 适应 故障 阔 值 。 随 后 ,提出 了 一 
个 基于 非 参数 核 估 计 的 动态 概率 模型 ,来 评估 性 能 退化 数据 的 条 件 概率 分 布 。 超 
过 该 自 适应 故障 临界 值 的 概率 分 布 被 视 为 可 靠 性 指标 ,优点 在 于 其 可 以 被 用 来 估 
计 没 有 大 量 的 经 验资 料 和 实验 数据 的 单个 设备 的 性 能 可 靠 性 。 同 时 ,支持 向 量 机 
算法 在 设备 预测 诊断 领域 也 具有 很 好 的 表现 "9 。 
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2.4 设备 维护 方法 的 研究 及 进展 


企业 设备 的 维护 决策 有 助 于 企业 按时 完成 经 营 目标 ,提高 设备 的 利用 率 和 
效能 ,运用 各 种 维护 技术 和 措施 ,在 使 用 过 程 中 对 设备 进行 维护 与 修理 改造 与 
保养 。 设 备 维护 具有 广泛 的 研究 领域 ,并 且 与 现代 的 企业 生产 和 工程 管理 的 发 
展 具 有 密切 的 关系 。 随 着 现代 科技 的 发 展 ,企业 的 设备 也 变 得 更 加 复杂 ,对 设备 
的 维护 要 求 也 越 来 越 高 。 随 着 设备 现代 化 水 平 的 不 断 提高 ,维护 主要 分 为 以 下 
四 种 。 

(1) 事后 维修 (corrective maintenance,CM)。 是 指 当 设备 发 生 故 障 , 或 者 在 设 
备 进行 日 常 的 停机 检查 时 发 现 故障 ,对 设备 采取 的 维护 方式 。CM 的 主要 目的 就 
是 去 除 设备 当前 遇 到 的 故障 。 在 初始 的 产业 革命 时 期 ,当时 的 工业 生产 规模 小 ,发 
生 故 障 的 后 果 一 般 并 不 严重 ,设备 故障 的 影响 仅 局 限于 设备 自身 ,为 了 提高 设备 的 
使 用 率 ,降低 不 必要 的 维护 产生 的 损失 ,可 以 采用 CM。 随 着 设备 复杂 性 和 科学 技 
术 的 发 展 ,CM 已 经 不 能 满足 当前 的 维护 需求 。 

(2) 预防 性 维护 (preventive maintenance, PM)。 是 指 对 设备 故障 以 预防 为 主 
要 目的 ,对 设备 进行 检查 和 检测 ,防止 设备 故障 发 生 , 在 设备 的 故障 征兆 被 发 现 后 ， 
采取 不 同 的 维护 决策 ,使 设备 保持 在 初始 的 功能 状态 。 目 前 ,在 当前 的 企业 生产 过 
程 中 ,PM 是 一 种 常见 的 预防 故障 发 生 的 方式 ,也 是 一 种 常见 的 维护 方式 。 

(3) 状态 维护 (condition based maintenance,CBM) 。 表 示 设 备 的 故障 从 开始 
发 生 到 发 展 总 有 一 段 出 现 异常 现象 的 时 间 , 而 并 不 是 瞬时 发 生 的 ,状态 维护 是 指 在 
设备 故障 出 现 前 找到 故障 迹象 ,预防 其 发 生 所 采取 的 各 种 维护 活动 。 利 用 日 常 检 
BE ,状态 连续 监测 ,设备 故障 诊断 所 获得 的 信息 ,通过 数据 统计 分 析 , 有 效 地 判断 恶 
化 程度 ,在 CBM 过 程 中 ,设备 的 运转 时 间 没 有 进行 明确 的 规定 ,对 于 设备 健康 预测 
的 有 效 利用 ,防止 了 CM 的 维修 不 足 及 PM 的 维修 过 度 ,是 企业 生产 中 最 经 济 、 合 
理 的 维护 决策 方式 。 

(4) 以 可 靠 性 为 中 心 的 维护 (reliability centered maintenance. RCM)。 在 系统 
进行 维护 时 ,可 对 其 他 没有 发 生 故 障 的 设备 进行 可 靠 性 的 检查 ,预先 发 现 设备 的 故 
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障 征兆 ,而 且 不 会 造成 多 余 的 停机 。 是 一 种 预防 设备 故障 重复 发 生 , 降 低 设 备 停机 
时 间 的 基于 可 靠 性 的 维护 方式 。 

基于 上 述 分 析 与 归纳 ,获得 目前 常用 的 四 种 维护 方式 的 分 析 结 果 , 如 图 2-4 
所 示 。 


状态 维护 以 可 靠 性 为 中 心 的 维护 
(CBM) (RCM) 
d [> ERE HL 一 考虑 设备 的 状态 和 故障 的 
=> 需要 维护 时 ， 采 取 有 效 的 。 | | | 影响 








2-4 四 种 维护 方式 


企业 在 执行 设备 的 维护 计划 时 ,在 很 多 情况 下 都 需要 对 多 种 维护 策略 进行 有 
效 的 合理 组 合 ,而 不 是 仅仅 采取 一 种 维护 策略 。 并 且 ,还 需要 考虑 在 执行 维护 策略 
后 的 设备 性 能 状态 。 通 常设 备 的 维护 策略 主要 有 以 下 三 类 。 

(1) AMBGninimal maintenance)。 对 设备 采取 小 修 策略 ,能 够 恢复 设备 的 功 
能 ,但 是 无 法 改变 设备 的 故障 状态 。 在 设备 小 修 后 ,设备 的 故障 发 展 趋势 不 变 。 

(2) 大 修 (imperfect maintenance)。 对 设备 采取 大 修 后 ,对 于 设备 的 故障 率 会 
发 生变 化 ,但 是 ,设备 无 法 修复 到 其 最 初 的 状态 。 

(3) 置换 (replacement maintenance) 。 对 设备 采取 置换 后 ,设备 将 修复 到 最 初 
状态 ,并 且 , 设 备 的 运行 特性 会 重复 上 一 个 周期 的 运行 特性 。 

有 效 合 理 的 维护 策略 可 以 保持 设备 持续 有 效 的 运转 ,因此 ,设备 的 维护 策略 得 
到 了 极 大 的 发 展 ,并 且 , 这 一 领域 的 内 容 也 获得 了 深入 的 研究 ,根据 不 同 设备 的 不 
同 维护 需求 ,建立 了 多 种 合理 有 效 的 维护 策略 模型 ,在 企业 生产 中 也 得 到 了 广泛 的 
应 用 。 
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2.4.1 基于 健康 信息 的 维护 


预测 的 目的 就 是 要 为 维护 方案 的 制订 提供 决策 支持 2 。 因 此 ,很 自然 地 ， 
需要 在 设备 状态 预测 的 过 程 中 考虑 下 一 步 的 维护 方案 。 上 一 部 分 总 结 的 设备 寿 
命 预测 的 方法 提供 了 设备 剩余 寿命 的 估计 ,而 维护 规划 是 在 此 基础 上 进一步 确 
定 恰当 的 执行 维护 的 时 间 。 可 见 , 比 起 寿命 预测 ,维护 规划 更 直接 地 决定 了 维护 
策略 的 有 效 与 否 ,更 直接 地 影响 了 一 个 企业 的 产能 。 但 是 ,维护 规划 问题 往往 较 
寿命 预测 更 为 复杂 。 总 结 目前 相关 文献 ,一 个 预防 维护 规划 模型 一 般 包 含 五 大 
因素 : 

(1) 目标 ,维护 费用 最 小 化 ,维护 费用 率 最 小 化 ,系统 平均 可 用 度 最 大 化 等 ; 

D 维护 方案 ,刻画 了 维护 执行 的 特点 (框架 ), 如 周期 性 维护 \ 顺 序 型 维护 、 控 
制 限度 维护 等 ; 

(3) 维护 质量 (或 维护 效果 ) ,刻画 了 维护 行动 将 设备 性 能 提升 的 程度 ,有 修复 
如 新 、 修 复 非 新 、 修 复 如 旧 等 ; 

CD 退化 模型 ,刻画 了 设备 退化 的 过 程 ,有 传统 的 寿命 分 布 . Gamma 过 程 、 马 
尔 可 夫 过 程 实 时 状态 监测 变量 模型 等 ; 

(5) 维护 限制 ,如 部 件 间 的 维护 冲突 维护 备件 有 限 等 。 

以 下 总 结 近年 来 主要 的 相关 模型 。 基 于 状态 监测 的 维护 规划 模型 分 类 方法 多 
样 ,例如 ,Jardine 等 人 中 将 之 分 为 完全 可 见 系统 和 部 分 可 见 系统 。 其 中 ,对 于 完全 
可 见 系统 ,状态 监测 变量 完全 体现 了 系统 的 真实 状态 ;对 于 部 分 可 见 系统 ,状态 监 
测 变量 不 能 完全 体现 系统 的 真实 状态 ,但 与 之 相关 。 

对 于 基于 设备 健康 信息 的 维护 决策 方法 ,文献 5 建立 了 基于 状态 检测 的 
单 设备 的 可 靠 度 维修 决策 模型 ,用 最 小 化 的 期 望 费用 为 模型 的 优化 目标 ,应 用 混合 
概率 的 模型 来 刻画 恢复 非 新 的 PM AE. CHRE 建立 了 基于 状态 检测 的 多 设备 
的 维修 决策 模型 ,模型 考虑 了 维修 的 限制 约束 条 件 , 以 最 小 化 系统 寿命 周期 内 的 维 
护 的 总 成 本 为 优化 目标 。 因 为 多 设备 之 间 的 相互 关联 ,单个 设备 的 最 优 维修 策略 
并 不 代表 整体 的 最 优 维护 策略 ,所 以 ,需要 建立 系统 级 别 的 维护 决策 模型 。 在 文献 
中 ,假设 多 设备 系统 的 失效 概率 是 已 知 的 ,没有 考虑 系统 在 实际 运行 过 程 中 的 状态 
是 不 断 变 化 的 这 一 情况 。 同 文献 5 相同 的 研究 还 见 文献 059 。 

文献 中 主 要 研究 了 状态 维护 ,在 维护 过 程 中 ,对 期 望 总 费用 率 进行 最 小 化 , 设 
备 的 修复 如 初 也 被 考虑 ,通过 获得 设备 的 检测 信号 ,建立 了 状态 空间 模型 。 在 模型 
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中 ,循环 算法 被 用 来 预测 设备 的 振动 信号 ,从 而 获得 设备 的 故障 概率 。 文献" 也 
同样 采取 了 这 一 方法 对 设备 执行 维护 决策 。 文 献 " 引 建立 了 在 线 自 适应 状态 的 维 
护 决 策 模型 ,而 且 应 用 状态 监测 数据 对 机 械 设 备 进行 维护 决策 。 

文献 5 假设 设备 失效 概率 既 依赖 它 的 工作 时 间 ,同时 也 依赖 一 个 诊断 随机 过 
程 ,用 PHM 来 描述 系统 失效 概率 ,借以 构建 一 个 蔡 换 优化 策略 来 最 小 化 系统 长 期 
期 望 的 总 费用 率 。Tran 和 Yang 提出 了 一 个 基于 设备 状态 信息 的 维护 策略 。 
其 中 ,基于 机 械 系统 的 预测 信息 ,进一步 使 用 PHM 估计 系统 的 可 靠 性 ,在 此 基础 
上 建立 一 种 新 的 智能 CBM 对 旋转 机 械 系 统 进行 维护 。 在 文献 9 中 中 ,一 种 基于 状 
态 检测 的 替换 优化 策略 被 研究 ,主要 目的 是 对 系统 的 期 望 总 费用 进行 最 小 化 ， 
PHM 被 用 来 对 系统 失效 率 进 行 估计 ;同时 ,假设 系统 的 检测 状态 符合 非 齐 次 马尔 
可 夫 过 程 , 从 而 来 估计 系统 失效 概率 ,最终 获得 系统 最 优 的 维护 限度 。 基 于 周期 监 
测 的 替换 优化 模型 ,文献 C 呈 最 小 化 系统 的 长 期 期 望 总 费用 率 ,考虑 了 检测 变量 是 
间接 地 对 系统 的 状态 进行 描述 ,并 且 , 与 系统 的 状态 随机 相关 ,用 PHM 来 估计 系 
统 失 效 概 率 ,从 而 构建 系统 的 费用 率 优 化 模型 。 同 样 ,文献 "也 提出 了 基于 
PHM 的 替换 优化 策略 。 

Wangb 通 过 贝 叶 斯 理论 融合 了 来 自 几 个 传感器 的 状态 数据 ,计算 一 个 隐 含 
状态 的 后 验 概率 分 布 ,然后 ,将 该 后 验 概率 值 与 预先 设置 好 的 阔 值 进行 比较 ,确定 
设备 是 否 需要 维护 。 考 虑 了 多 变量 贝 叶 斯 控制 图 的 设计 ,计算 状态 之 间 的 转移 概 
率 和 监测 信息 间 的 关系 ,蒙特 卡 洛 仿真 用 于 获得 最 优 的 监测 间隔 ,为 设备 提供 最 优 
的 维护 策略 。 基 于 监测 过 程 积累 的 知识 ,Elhdad57 提 出 了 一 种 新 颖 的 架构 和 设 
计 , 以 提高 维护 决策 。 监 测 过 程 是 基于 在 核电 厂 的 安全 关机 过 程 中 被 触发 的 信号 。 
为 了 提高 维修 的 决策 ,延长 本 体 和 框架 确保 决策 者 有 足够 的 信息 在 正确 的 时 间 做 
出 正确 的 决定 ,Horenbeek 和 Pintelon55 提出 了 一 个 系统 动态 预测 维护 策略 ,以 
单位 时 间 的 平均 长 期 维护 成 本 为 目标 ,利用 系统 的 预测 信息 和 系统 内 部 不 同 元 件 
之 间 的 依赖 性 ,对 系统 采取 最 优 的 维护 决策 。Guo 等 人 中 提出 了 一 个 Wiener pi 
机 过 程 的 模型 ,处 理 任务 导向 系统 的 逐步 衰退 过 程 ,制定 相应 的 维护 策略 。 对 于 一 
个 以 任务 为 导向 的 系统 ,任务 通常 具有 可 用 性 /可 靠 性 、 维 修 动 作 的 机 会 ,监测 类 型 
(连续 或 离散 ) 的 约束 。 基 于 设备 的 可 靠 性 信息 ,Zhao 等 人 9 应 用 一 个 标准 的 累 
积 损伤 模型 来 执行 维护 计划 ,确定 在 故障 发 生前 ,设备 可 以 得 到 充足 的 维护 。 同 
时 , 随 着 维护 技术 的 发 展 ,也 出 现 了 相应 的 维护 管理 平台 ,并 且 , 针 对 维护 管理 平台 
的 缺陷 ,提出 了 相应 的 改进 措施 "3 。 
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2.4.2 基于 衰退 过 程 的 维护 


针对 基于 设备 衰退 过 程 的 维护 决策 方法 ,文献 "中 建立 了 基于 状态 监测 的 备件 
订货 一 替换 决策 模型 ,模型 考虑 了 维护 的 备件 需要 提前 预订 ,假设 设备 在 使 用 中 符 
合 衰退 增 量 是 单调 递增 的 随机 衰退 模型 ,在 每 个 时 刻 , 增 量 之 间 是 相互 独立 的 ,并 
且 , 统 计 分 布 是 相同 的 。 在 文献 "中 的 基础 上 ,文献 "考虑 了 设备 失效 阀 值 的 不 确 
定性 这 一 情况 ,文献 9 考虑 了 基于 Markov 衰退 过 程 的 预防 蔡 换 优化 模型 及 新 的 
库存 机 制 。 文 献 中 构建 了 一 个 新 的 随机 过 程 ( 伽 马 进程 ), 用 来 描述 设备 衰退 过 
程 ,还 考虑 了 设备 健康 状态 的 概率 分 布 ,最 终 来 确定 设备 维护 策略 。 同 样 ,文献 Ps 
也 提出 了 一 个 性 能 衰退 系统 的 维护 决策 模型 。 

文献 " 纠 建 立 了 基于 状态 检测 地 PM 模型 ,以 最 小 化 的 期 望 成 本 为 优化 目标 ， 
在 PM 模型 中 ,假设 系统 可 以 被 完全 修复 ,并 且 , 如 果 系 统 的 状态 值 达到 设 定 的 阔 
值 时 ,PM 被 采取 。 文 献 "9 延 续 了 这 部 分 研究 工作 ,建立 了 一 个 由 两 个 串联 设备 
组 成 的 系统 级 的 维护 决策 模型 。 在 这 部 分 研究 基础 上 ,文献 Cs 考虑 了 设备 修复 非 
新 这 一 情况 ,并 且 假 设 修复 后 设备 的 健康 状态 随机 地 处 于 修复 前 与 全 新 的 健康 状 
态 之 间 。 同 样 类 似 的 研究 见 文献 Cs9 。 

文献 "中 建立 了 基于 状态 检测 的 蔡 换 优化 模型 ,并 且 , 在 某 个 时 刻 点 的 设备 故 
障 概率 可 以 用 随机 参数 的 增长 模型 进行 估计 ,监测 区 间 及 最 优 的 维护 限度 根据 模 
型 被 确定 ,提高 了 设备 的 可 靠 性 。 文 献 s2s 提出 了 基于 状态 检测 的 漂移 衰退 过 
程 的 维护 优化 策略 ,以 最 小 化 某 段 时 间 的 平均 维修 费用 为 目标 ,将 整个 漂移 衰退 过 
程 划分 为 CN 十 1) 段 ,用 Markov 过 程 进行 建 模 ,采取 控制 限度 的 维护 优化 策略 , 获 
得 了 最 优 的 监测 时 间 间 隔 和 最 优 的 维护 时 间 。 文 献 P* 2 提出 了 基于 状态 检测 的 
随机 衰退 系统 的 蔡 换 优 化 模型 ,获得 设备 的 最 优 维护 的 阔 值 及 最 优 监测 的 时 刻 点 ， 
提高 了 设备 的 利用 率 , 并 且 , 假 设 系统 状态 的 衰退 在 所 有 时 刻 都 是 非 负 的 ,已 知 系 
统 的 状态 衰退 的 增长 程度 概率 密度 函数 及 确定 性 的 失效 阔 值 ,来 估计 系统 某 时 刻 
的 失效 概率 。 此 外 ,文献 "3 考虑 了 两 种 系统 失效 情况 :系统 累计 损伤 和 应 力 环境 
条 件 下 的 系统 冲击 ,从 而 来 优化 系统 的 期 望 总 费用 率 。 

文献 "中 考虑 了 设备 状态 衰退 具有 非 单调 的 特征 ,在 设备 监测 过 程 中 , 受 环境 
因素 的 影响 ,用 替换 优化 模型 来 优化 设备 的 总 费用 率 ,并 且 用 PHM 来 描述 环境 因 
素 对 设备 状态 的 衰退 影响 。 文 献 59 考 虑 了 多 设备 系统 的 维护 情况 ,文中 假设 系统 
受到 来 自 外 界 的 随机 性 冲击 ,如 果 在 使 用 中 ,设备 的 累积 损伤 达到 某 个 阔 值 时 , 设 
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备 会 发 生 故 障 。 从 而 ,对 系统 进行 PM 决策 ,在 维护 过 程 中 ,通过 计算 优化 该 阔 值 
来 最 小 化 系统 的 长 期 期 望 总 费用 率 。 文 献 C55 建 立 了 一 种 接受 连续 性 监测 的 单 设 
备 系统 的 PM 模型 ,并 且 寻 找 最 优 的 控制 限度 来 最 大 化 该 系统 的 平均 可 用 度 ,根据 
随机 衰退 优化 模型 来 计算 系统 失效 概率 。 在 文献 9 中 中 ,预测 性 维护 策略 被 发 展 ， 
通过 对 系统 进行 实时 监测 ,来 自传 感 器 的 在 线 衰减 信号 被 用 来 对 系统 衰退 模型 进 
行 更 新 ,从 而 对 系统 的 剩余 寿命 有 效 预测 进行 更 新 。 

Nevesa 等 人 9 中 结合 优化 模型 和 来 自 经 验 数 据 的 输入 参数 估计 ,提出 基于 状 
态 的 维护 策略 。 通 过 离散 状态 下 令 状 态 从 “新 "到 “完全 失效 ”来 描述 设备 的 退化 
信息 ,主要 目的 就 是 提出 一 个 执行 最 优 维护 策略 的 算法 ,对 于 模型 参数 估计 发 展 一 
个 递归 程序 。 为 了 充分 利用 分 析 和 仿真 模型 的 优势 ,Kahrobaee 和 Asgarpoort?? 
提出 了 一 个 混合 仿真 分 析 的 方法 ,解决 实际 系统 的 维护 优化 问题 。 在 这 种 方法 的 
第 一 步 中 ,使 用 半 马 尔 可 夫 决策 过 程 获得 风力 涡轮 机 的 最 佳 维护 策略 。 然 后 ,蒙特 
卡 罗 仿 真 建 立 模型 和 求解 模型 ,对 得 到 的 结果 与 仿真 模型 的 识别 结果 进行 了 比较 。 
在 第 二 步 中 ,对 系统 可 用 性 和 成 本 产生 影响 的 保养 与 维修 效果 ,以 及 系统 的 退化 信 
息 ,使 用 仿真 模型 进行 了 研究 ,开发 的 模型 可 以 帮助 资产 管理 者 进行 合理 的 维护 决 
策 。Len 和 Tan 研究 了 一 个 退化 系统 的 维护 策略 ,每 个 退化 水 平 都 可 以 用 一 
个 状态 来 表示 ,因此 ,系统 变 成 了 一 个 多 状态 系统 。 在 许多 情况 下 ,对 于 系统 的 
状态 没有 明显 的 症状 ,只 能 通过 彻底 的 检查 来 了 解 系统 的 退化 程度 。 通 过 状态 
监测 ,不 确定 性 的 系统 状态 可 以 被 估计 ,然后 根据 监测 的 退化 状态 ,安排 设备 的 
维护 策略 。 


2.4.3 基于 备件 库存 的 维护 


设备 的 备件 是 设备 维护 的 重要 资源 。 因 而 ,备件 的 库存 管理 成 为 设备 管理 中 
十 分 重要 的 内 容 , 可 以 保障 设备 高 的 可 靠 度 , 同 时 ,备件 库存 需要 占用 大 量 的 企业 
流动 资金 ,从 而 影响 了 企业 的 经 济 效益 。 为 了 快速 地 满足 市 场 的 需求 ,减少 备件 缺 
货 所 造成 的 设备 停机 损失 ,必须 预测 备件 需求 ,进而 采用 合适 的 备件 库存 策略 。 过 
去 对 备件 库存 的 学 习 主 要 集中 在 库存 策略 的 优化 与 应 用 ,怎样 在 确保 一 定 的 服务 
水 平 或 总 成 本 最 低 的 情况 下 确定 库存 水 平等 方面 。 

预测 性 维护 可 提供 当前 或 预测 系统 的 健康 状况 ,并 使 用 预测 信息 启动 维护 行 
动 。 预 测 性 维护 的 研究 涉及 备件 库存 管理 、 维 修 策略 优化 和 评估 。 目 前 ,已 建立 的 
数学 模型 可 用 来 描述 考虑 备件 库存 预测 性 维护 52" ?9 。 
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Basten 等 人 2 设计 了 一 个 最 佳 的 解决 算法 ,进行 设备 维护 和 备件 库存 的 联合 
优化 。Huynh 等 人 25 在 考虑 设备 备件 的 基础 上 ,研究 了 以 最 小 的 单 部 件 可 修 系 
统 的 维修 次 数 为 目标 的 设备 维修 保养 策略 。Wang59 构建 了 一 个 联合 的 备件 和 维 
修 检查 的 优化 模型 ,使 用 延迟 时 间 的 概念 描述 设备 的 故障 过 程 ,其 中 故障 过 程 被 分 
为 两 个 阶段 ,考虑 了 三 个 决策 变量 的 联合 优化 :订货 量 . 订货 间 隔 和 检查 间隔 。 
Wangf 提 出 了 备件 库存 控制 和 预防 性 维护 检查 间隔 的 联合 优化 。 所 有 这 些 研究 
都 涉及 设备 的 维护 和 备件 库存 的 联合 优化 。 

在 文献 上 9 中 ,基于 设备 的 状态 监测 ,一 种 订货 一 替换 模型 被 提出 ,在 提出 的 模 
型 中 ,维修 所 需要 的 部 件 要 提前 进行 预订 这 一 情况 被 考虑 进去 。 基 于 设备 的 剩余 
有 效 寿命 估计 ,Rausch 和 Liaor*" 中 讨论 了 联合 生产 与 备件 库存 控制 策略 ,并 且 采 取 
状态 维护 的 方式 。 退 化 信息 用 于 启动 更 换行 动 ,配合 备件 库存 控制 ,同时 ,以 生产 
批 次 大 小 和 到 期 日 期 作为 限制 条 件 。Elwany 和 Gebraeel??? 提出 了 一 个 设备 剩余 
有 效 寿命 和 备件 库存 决策 模型 的 衰退 模型 框架 ,用 来 自己 有 的 置换 元 件 的 状态 检 
测 信息 获得 设备 的 剩余 寿命 分 布 。 还 有 另外 关于 备件 优化 的 文献 ,在 这 些 文献 中 ， 
主要 关注 点 是 备件 的 优化 问题 而 不 是 设备 的 维护 问题 。Lin 等 人 中 考虑 了 满足 
设备 维护 的 备件 的 存货 水 平 点 ,每 台 机 器 都 包含 相同 的 重要 组 成 部 分 ,并 且 用 马尔 
可 夫 过 程 描述 这 些 元 件 的 衰退 行为 。 在 系统 的 运行 监测 过 程 中 ,Louit 45 AC gi 
立 了 一 个 模型 来 确定 备件 的 订货 决策 。Li 和 Ryan? 提出 了 一 个 新 的 模型 ,在 模 
型 中 ,将 实时 状态 监测 信息 集合 到 备件 库存 管理 决策 中 ,并 用 退化 模型 推导 出 一 个 
正常 运作 的 部 件 的 寿命 分 布 , 用 以 估计 备件 的 订货 需求 。Khanh Nguyen % AC 
通过 马尔 可 夫 决 策 过 程 研究 了 在 技术 变革 下 备件 库存 对 设备 维护 和 更 换 策略 的 影 
响 。 更 换 决策 的 制定 是 一 个 复杂 的 过 程 , 需 要 确定 取代 当前 设备 的 技术 是 可 行 的 。 
详细 的 关于 备件 库存 和 设备 维护 之 间 的 关系 ,可 以 看 综述 文章 9 。 


2.5 设备 维护 调度 方法 的 研究 及 进展 


自 20 世纪 30 年 代 起 ,在 现代 工业 的 生产 中 ,设备 管理 越 来 越 重 要 。 设 备 管理 
主要 是 以 将 设备 效能 进行 最 大 化 .生产 需求 最 优化 、 经 济 效益 最 大 化 为 目标 ,通过 
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各 种 先进 的 管理 技术 和 有 效 措施 ,对 设备 进行 采购 装配、 维护 改装 及 更 新 的 寿命 
周期 的 全 过 程 的 管理 。 目 前 ,对 于 维护 调度 技术 的 研究 仍然 处 于 初级 阶段 。 设 备 
的 维护 调度 优化 是 联合 维护 管理 思想 的 具体 体现 。 

本 书 的 研究 对 象 液压 泵 是 一 类 复杂 多 部 件 的 设备 ,对 于 这 一 类 设备 ,在 维护 过 
程 中 ,如 果 设备 的 部 件 之 间 在 结构 故障、 经济 上 都 不 具有 相互 关联 性 时 ,说 明 每 个 
部 件 是 相互 独立 的 ,对 每 个 部 件 采 取 的 维护 策略 也 是 相互 独立 的 ,每 个 设备 部 件 的 
最 优 维护 策略 构成 了 整个 设备 的 最 优 维护 策略 。 对 于 多 部 件 设备 ,在 对 某 个 部 件 
进行 维护 时 ,除了 考虑 自身 的 工作 状态 外 ,还 要 考虑 其 他 部 件 具有 的 工作 运行 状 
态 。 比 如 , 当 设 备 中 某 个 部 件 发 生 故 障 , 需 要 采取 维护 活动 时 ,设备 进行 停机 ,在 这 
个 过 程 中 ,对 设备 中 的 剩余 部 件 也 采取 相应 的 维护 活动 ,虽然 它们 可 能 没有 发 生 故 
障 , 或 者 没有 达到 它们 的 维护 时 刻 , 但 是 ,同时 维护 可 以 有 效 地 降低 整个 设备 的 维 
护 成 本 。 

对 于 多 部 件 设备 的 维护 内 容 , 当 前 的 研究 还 不 是 太 多 ,目前 ,常用 的 两 类 维护 
建 模 为 :D 考 虑 设备 劣化 是 连续 的 随机 过 程 时 ,对 设备 进行 建 模 。 四 考虑 设备 劣化 
是 离散 的 随机 过 程 时 ,利用 马尔 可 夫 链 理论 ,发现 设备 劣化 的 规律 ,在 劣化 过 程 中 ， 
当 达 到 某 一 辣 值 时 ,采取 对 应 的 维护 活动 。 文 献 中 对 一 般 混 联 的 多 部 件 设备 维护 
决策 的 问题 进行 了 研究 ,利用 马尔 可 夫 链 的 思想 ,建立 了 系统 的 视 情 维修 策略 。 文 
献 中 建立 了 多 元 件 系 统 的 PM 策略 模型 ,在 对 系统 进行 维护 的 过 程 中 ,考虑 环境 
因素 对 设备 的 影响 。 在 文献 cs 中 ,对 多 部 件 且 并 联系 统 执行 维护 调度 ,以 期 望 成 
本 的 最 小 化 为 目标 。 文 献 " 叶 研究 了 多 部 件 设备 制造 系统 的 生产 与 PM 问题 ,建立 
了 双 层 的 优化 模型 。 文 献 ns 2 都 对 并 联 的 多 部 件 设备 系统 进行 了 维护 决策 建 
模 ,分 析 了 并 联系 统 的 维护 策略 。 

对 于 多 部 件 设 备 的 维护 是 不 同 于 单 部 件 设备 的 维护 的 ,主要 是 因为 多 部 件 设 
备 存 在 相关 性 5s5 。 多 部 件 设备 之 间 具 有 经 济 相关 性 、 结 构 相 关 性 和 随机 相关 
性 。 在 一 个 时 间 段 内 对 多 个 部 件 同时 采取 维护 活动 ,与 分 别 对 设备 中 的 单个 部 件 
采取 维护 活动 相 比 ,会 更 加 节省 维护 费用 ,这 就 称 为 系统 经 济 相关 性 。 在 整个 设备 
中 ,有 并 联 、 串 联 和 混 联 三 种 方式 , 当 对 设备 中 的 某 个 部 件 进 行 维护 时 ,会 产生 其 他 
部 件 的 停机 ,这 就 称 为 设备 结构 相关 性 。 在 设备 的 部 件 间 ,出 现 的 故障 是 不 独立 
的 ,相互 影响 的 ,这 就 称 为 设备 随机 相关 性 。 所 以 ,在 维护 决策 时 ,为 了 更 加 满足 设 
备 的 实际 情况 ,在 维护 过 程 中 需要 考虑 设备 的 相关 性 。 目 前 ,多 部 件 设备 的 维护 策 
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略 主要 有 以 下 两 种 。 

1. 多 部 件 设备 的 成 组 维护 

成 组 维护 是 指 在 同一 时 刻 对 设备 中 不 同 部 件 进行 维护 ,以 保证 部 件 的 可 靠 性 
或 降低 设备 运行 成 本 的 维护 策略 。 成 组 维护 具有 三 个 研究 方向 " ,第 一 个 方向 
是 :对 部 件 根据 依赖 因素 进行 分 类 ,可 同时 进行 同类 部 件 的 维修 。 第 二 个 方向 是 : 
考虑 部 件 的 备件 ,对 设备 总 的 维护 成 本 进行 优化 。 第 三 个 方向 是 :对 具有 相同 的 故 
障 分 布 ,并 且 独 立 运行 的 部 件 进行 维修 。 

在 一 些 复杂 设备 中 , 常 存在 一 组 相同 类 型 的 部 件 在 相同 的 使 用 条 件 下 进行 工 
作 的 情况 。 多 部 件 设备 成 组 维护 策略 表示 某 一 部 件 发 生 故 障 ,并 进行 维护 时 ,其 他 
的 同类 型 无 故障 的 部 件 一 并 进行 维护 ,包括 成 组 维护 策略 mm 成 组 维护 策略 及 
(TT,m) 成 组 维护 策略 "9 。 个 成 组 维护 策略 表示 指定 役 龄 成 组 的 更 换 策 略 。 也 
就 是 说 , 当 系 统 的 役 龄 到 达 工时 ,对 于 所 有 相同 的 设备 一 并 进行 更 换 。zz 成 组 维 
护 策略 描述 了 基于 故障 数量 的 成 组 维护 策略 。 也 就 是 说 , 当 多 部 件 系 统 出 现 取 
次 故障 时 ,采取 成 组 更 换 。(T,m) 成 组 维护 策略 表示 将 以 上 的 两 种 策略 进行 组 合 ， 
当 多 部 件 系统 达到 了 使 用 时 间 工 或 者 系统 出 现 了 m 次 的 故障 后 ,采取 成 组 维修 。 
文献 中 对 一 组 具有 同样 的 指数 使 用 寿命 分 布 的 设备 建立 了 成 组 维护 策略 。 针 对 
系统 的 全 面 检查 ,可 获得 系统 中 发 生 故 障 的 设备 数 , 并 依据 发 生 故障 的 设备 数 来 决 
定 是 不 是 对 系统 采取 成 组 维护 。Liucz 对 M 个 相同 设备 (可 能 发 生 随机 故障 ) 建 
立 了 一 种 优化 的 成 组 维护 策略 ,并 引入 了 四 种 设备 健康 状态 :状态 好 、 状 态 可 疑 应 
该 进行 PM 和 失效 。 针 对 生产 设备 服从 一 般 的 正常 寿命 分 布 的 情况 ,构建 了 一 个 
估计 优化 模型 来 区 分 四 种 健康 状态 , 且 假 设 好 的 状态 和 可 疑 的 状态 的 持续 有 效 时 
间 服 从 指数 分 布 。 文 献 5C 轨 对 一 组 设备 故障 时 间 服 从 Weibull 分 布 的 相互 间 独立 
的 多 设备 生产 系统 ,建立 了 成 组 维护 策略 。 其 优化 的 维护 计划 不 但 能 满足 设备 的 
可 靠 度 要 求 ,还 能 最 小 化 设备 总 的 维护 费用 。 文 献 C 裤 对 k-out-of-N 的 系统 采取 成 
组 维护 策略 的 情况 下 ,还 对 维护 间隔 、 维 护 备 件 和 维护 能 力 对 系统 的 可 用 度 影响 
进行 了 研究 。 文 献 中 对 复杂 系统 的 维护 费用 的 构成 和 系统 的 利用 率 进行 了 分 
析 , 并 且 用 故障 风险 作 约 束 ,用 最 小 化 系统 的 总 维护 费用 以 及 最 大 化 利用 率 作为 
优化 目标 ,提出 了 系统 的 维护 策略 优化 模型 。 文 献 C5 中 也 对 成 组 维护 策略 进 
行 了 有 益 的 探索 。 文献" 1 针对 随机 发 生 故 障 的 一 个 制造 系统 ,研究 生产 调度 过 
程 中 如 何 有 效 地 控制 设备 PM 和 故障 维护 的 问题 ,以 设备 的 维护 成 本 、 设 备 库存 
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成 本 及 生产 延迟 成 本 最 小 化 为 优化 目标 ,通过 优化 算法 对 模型 进行 了 分 析 , 从 而 
制定 最 优 的 库存 控制 策略 ,同时 ,对 该 策略 的 应 用 以 及 后 续 扩 展 问题 进行 了 
讨论 。 

2. 多 部 件 设备 的 机 会 维护 

机 会 维修 是 指 当 设备 运转 时 ,因为 某 个 部 件 发 生 了 故障 或 者 进行 维护 需要 停 
机 ,而 其 他 没有 发 生 故 障 并 且 役 龄 满足 预定 条 件 的 部 件 因此 获得 了 维护 机 会 可 以 
提前 采取 维修 的 维护 策略 。 机 会 维护 最 先是 由 Radner 等 人 9 中 和 McCall? 5? 进行 
人 研究。 根据 系统 配置 形式 的 不 同 , 已 有 多 种 机 会 维护 策略 被 提出 。 

Bergbs5 研 究 了 具有 指数 故障 率 分 布 的 两 台 相 同 设备 的 机 会 维修 策略 : 当 一 台 
设备 出 现 故 障 时 ,采取 维护 措施 ;对 于 另 一 台 设 备 , 如 果 使 用 寿命 大 于 其 阔 值 ,需要 
同时 采取 维护 措施 。Laggoune 等 人 0 提出 了 一 种 多 元 件 串 联系 统 的 机 会 维修 替 
换 策略 ,以 不 确定 的 数据 为 背景 ,在 设备 寿命 分 布 确 定 后 ,以 单位 时 间 的 期 望 成 本 
为 目标 ,对 故障 进行 维修 。 故 障 设备 被 修复 ,同时 其 他 设备 被 保养 ,这 样 所 有 部 件 
都 被 维修 且 恢 复 为 某 一 个 健康 状态 。 文 献 " 叶 建立 了 一 个 多 部 件 设备 累积 的 故障 
冲击 优化 模型 , 且 建 立 机 会 维护 策略 模型 。 维 护 策略 根据 每 台 设 备 故 障 的 时 间 点 
来 决定 。 且 每 次 出 现 故 障 时 ,采取 维护 策略 进行 维修 ,而 且 , 对 于 其 他 的 部 件 进行 
保养 维护 ,因此 所 有 部 件 都 被 维修 且 恢 复 到 某 一 个 健康 状态 。 这 种 维修 组 合 采 用 
CM 和 PM, 有 利于 维修 成 本 的 节约 。 文 献 " 吕 应 用 机 会 维护 策略 将 PM 和 故障 维 
护 有 机 地 结合 起 来 ,进而 可 以 分 摊 系 统 固定 的 维护 费用 ,达到 节约 维护 费用 的 
目的 。 

文献 st2s 研 究 了 不 同 设备 所 组 成 的 串 行 的 生产 系统 ,并 且 用 引入 了 整合 役 
龄 的 递减 因子 及 故障 率 的 递增 因子 单 设 备 PM 模型 ,构建 了 基于 各 设备 的 可 靠 性 
的 串 行 系统 的 机 会 动态 维修 决策 模型 。 文 献 C 中 研究 了 多 元 件 系 统 的 机 会 维护 策 
略 , 把 多 元 件 系统 分 解 为 单元 件 系 统 , 用 马尔 可 夫 决策 过 程 对 每 个 单元 件 系统 进行 
维护 调度 建 模 。 文 献 C 史 提出 了 一 个 基于 CBM 的 生产 系统 的 动态 维护 调度 模型 。 
文献 中 提 出 了 一 个 优化 的 粒子 群 算法 ,对 电力 系统 进行 维护 调度 。 与 机 会 维修 相 
关 的 其 他 模型 可 以 参考 文献 25 的 综述 。 

对 于 维护 调度 的 方法 汇总 如 图 2-5 所 示 。 
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图 2-5 维护 调度 的 方法 汇总 
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2.6 现 有 方法 的 不 足 


随 着 企业 设备 维护 调度 的 重要 性 日 益 增 加 ,为 了 实施 符合 企业 生产 的 维护 调 
度 策略 ,有 效 提高 企业 的 生产 效率 ,实现 企业 的 全 部 效能 ,发 挥 设 备 的 先进 性 ,必须 
进行 设备 的 健康 预测 ;基于 设备 健康 状态 的 预测 信息 和 衰退 性 能 ,建立 完整 的 设备 
集成 动态 维护 策略 。 然 后 ,结合 设备 的 集成 动态 维护 ,实现 多 部 件 设备 的 维护 调度 
优化 。 但 是 ,当前 的 设备 健康 预测 .设备 维护 和 维护 调度 优化 显得 有 点 薄弱 ,因此 ， 
基于 上 节 的 文献 综述 ,本 节 指 出 一 些 值得 研究 的 问题 。 


2.6.1. 设备 健康 预测 研究 的 不 足 


为 了 保持 企业 生产 设备 高 效 安全 地 运转 ,需要 及 时 有 效 地 进行 设备 的 维护 ,以 
便 提 高 企业 的 竞争 力 。 如 今 , 随 着 生产 要 求 的 提高 ,提高 设备 的 可 靠 性 成 为 突出 问 
题 。 同 时 , 随 着 市 场 竞争 的 加 剧 ,企业 对 设备 的 可 靠 性 .安全 性 和 有 效 性 要 求 更 高 。 
基于 这 些 事实 ,合理 有 效 的 维护 决策 就 变 得 十 分 重要 ,可 靠 精 确 的 健康 预测 ,为 进 
行 合理 有 效 的 设备 维护 提供 了 基础 。 

基于 2. 2 节 的 内 容 , 针 对 健康 预测 的 方法 存在 的 许多 问题 ,对 物理 模型 来 说 ， 
在 不 需要 大 量 同类 设备 的 历史 数据 的 情况 下 ,也 可 以 实现 模型 的 较 精 确 的 预测 。 
然而 ,在 进行 预测 时 ,需要 对 设备 进行 停机 监测 ,在 实际 的 生产 过 程 中 ,这 是 不 经 济 
的 ,也 是 不 允许 的 。 同 时 ,针对 当前 的 一 些 复杂 设备 ,很 难 建立 完整 的 物理 模型 。 
基于 数据 驱动 的 设备 健康 预测 方法 具有 两 个 比较 大 的 缺陷 :非常 慢 的 收敛 性 及 容 
易 陷入 局 部 最 优 解 。 由 于 数据 驱动 的 原因 ,这 些 模 型 具有 很 高 的 计算 复杂 性 ,容易 
造成 计算 爆炸 问题 ,这 些 缺 陷 限 制 了 方法 的 应 用 和 发 展 。 基 于 模型 驱动 的 设备 健 
康 预测 方法 的 识别 和 训练 过 程 需要 耗费 较 长 的 时 间 , 不 适合 设备 实时 的 健康 预测 。 
因此 ,这 类 模型 常用 于 离线 设备 的 健康 预测 。 

合理 建立 在 线 设备 健康 预测 非常 重要 ,基于 对 设备 健康 预测 相关 文献 回顾 后 发 
现 的 不 足 与 局 限 ,本 书 根据 SMC 方法 的 在 线 特性 ,以 及 HSMM 的 数学 特性 ,将 两 种 
方法 进行 拟 合 ,SMC 用 于 降低 模型 的 计算 复杂 性 ,HSMM 用 于 识别 设备 的 健康 状态 ， 
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获得 状态 的 转移 概率 和 状态 驻 留 。 基 于 这 些 原理 ,本 书 提出 了 基于 设备 联合 概率 的 
多 步 向 前 健康 预测 算法 和 设备 健康 预测 模型 ,进一步 研究 设备 的 在 线 健康 预测 。 

对 于 多 传感器 的 设备 健康 预测 ,通过 前 面 章节 的 文献 回顾 ,主要 存在 以 下 三 个 
问题 :@ 来 自 多 传感器 的 监测 数据 在 没有 有 效 处 理 的 情况 下 ,直接 作为 健康 预测 模 
型 的 输入 ;@ 来 自 多 传感器 的 监测 数据 仅仅 进行 了 降 维 处 理 , 就 直接 作为 健康 预测 
模型 的 输入 ;3 对 来 自 多 传感器 的 监测 数据 分 配 权重 ,每 个 传感器 被 赋予 了 一 个 权 
重 , 然 后 作为 健康 预测 模型 的 输入 。 针 对 以 上 这 些 缺 陷 , 本 书 在 对 HSMM 进行 改 
进 的 基础 上 ,提出 了 自 适 应 HSMM(AHSMM) ,这 个 模型 可 以 很 好 地 实现 多 传 感 
器 之 间 的 有 效 融 合 , 进 一 步 研 究 了 基于 多 传感器 的 设备 健康 预测 。 


2.6.2 设备 维护 研究 的 不 足 


目前 ,设备 的 维护 方法 存在 许多 问题 。 对 于 一 般 的 维护 模型 ,设备 的 预测 信息 
和 诊断 信息 都 没有 被 使 用 。 对 于 在 维护 模型 中 使 用 的 可 靠 性 信息 ,也 是 来 自 相 似 
设备 的 可 靠 性 信息 ,即使 对 CBM, 也 仅仅 是 使 用 当前 的 设备 状态 信息 。 对 于 基于 
设备 衰退 过 程 的 维护 策略 ,基本 上 是 只 考虑 了 设备 的 退化 信息 和 设备 的 老化 信息 。 
对 于 基本 备件 库存 策略 的 维护 ,也 只 是 考虑 了 备件 这 一 种 资源 ,而 没有 考虑 其 他 的 
维护 所 需要 的 资源 。 这 些 因素 都 限制 了 设备 维护 模型 的 发 展 。 

因此 ,合理 建立 设备 维护 模型 就 显得 非常 重要 ,基于 对 设备 维护 相关 文献 回顾 
后 发 现 的 不 足 与 局 限 , 本 书 考虑 了 设备 的 预测 信息 和 诊断 信息 .设备 的 衰退 信息 ， 
包括 将 设备 的 退化 信息 和 老化 信息 结合 到 设备 的 维护 模型 中 。 然 后 ,不 同 于 其 他 
单一 故障 状态 的 维护 模型 ,应 用 HSMM 模型 来 识别 设备 的 不 同 健康 状态 ,获得 不 
同 状态 间 的 转移 概率 和 不 同 状 态 的 驻 留 时 间 。 对 每 个 健康 状态 ,发 展 不 同 的 维护 
动作 ,使 每 个 健康 状态 都 被 优化 到 不 同 的 目标 。 针 对 单一 的 维护 资源 ,还 考虑 了 在 
设备 维护 过 程 中 对 维护 人 员 的 需求 量 ,将 维护 人 员 也 结合 到 设备 维护 模型 中 。 最 
后 ,基于 设备 的 衰退 过 程 和 维护 资源 ,提出 了 一 个 考虑 设备 多 故障 状态 的 双 层 集成 
动态 维护 模型 ,第 一 层 主要 用 于 获得 最 优 的 资源 成 本 和 资源 策略 ;第 二 层 主要 是 获 
得 最 优 的 维护 策略 ,从 而 进一步 研究 设备 的 集成 动态 维护 策略 。 


2. 6.3 设备 维护 调度 优化 需要 研究 的 问题 


目前 ,大 多 数 多 部 件 设备 的 维护 调度 都 仅仅 只 考虑 设备 的 可 靠 性 数据 ,没有 考 
虑 设备 的 其 他 状态 信息 ,如 设备 的 老化 与 退化 等 。 同 时 ,完整 的 剩余 寿命 在 预测 性 
维护 调度 中 没有 表现 出 来 。 在 目前 关于 设备 维护 调度 的 模型 中 ,可 以 用 修复 如 新 
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来 描述 设备 的 维修 效果 。 也 就 是 说 ,设备 的 维护 可 以 让 设备 修复 到 原始 的 最 佳 状 
态 。 而 实际 情况 是 设备 并 不 能 修复 如 新 ,仅仅 能 获得 状态 的 部 分 优化 。 目 前 ,这 类 
研究 内 容 不 多 见 。 

针对 多 部 件 设备 维护 调度 优化 的 文献 分 析 ,发 现存 在 以 下 几 个 问题 。 

(1) 基于 设备 的 维护 类 型 。 预 测 性 维护 针对 性 强 , 在 设备 维护 过 程 中 ,具有 极 
高 的 有 效 性 和 经 济 性 。 由 于 预测 性 维护 需要 对 设备 进行 传感器 检测 .故障 诊断 以 
及 寿命 预测 ,在 制定 设备 合理 有 效 的 维护 决策 时 ,具有 一 定 的 复杂 性 ,同时 ,因为 前 
期 需要 对 设备 进行 有 效 监 测 等 工作 ,投入 的 前 期 成 本 较 高 ,所 以 ,针对 设备 的 预测 
性 维护 研究 较 少 。 

(2) 基于 研究 的 对 象 。 设 备 部 件 间 的 关联 关系 ,包括 并 联 、 串 联 和 混 联 三 种 关 
系 。 其 中 , 混 联 是 最 复杂 和 最 有 代表 性 的 一 种 互联 关系 ,具有 极 大 的 复杂 性 ,并 且 , 设 
备 部 件 之 间 的 结构 相关 性 、 随 机 相关 性 及 经 济 相 关 性 影响 极 大 ,关系 错综复杂 ,使 模 
型 具有 复杂 的 求解 过 程 ,所 以 ,对 于 这 一 类 的 多 部 件 设备 的 维护 决策 研究 较 少 。 

(3) 基于 研究 的 内 容 。 对 于 设备 维护 的 研究 内 容 , 在 设备 的 维护 决策 周期 R 
取 维 护 的 时 间 点 以 及 采取 的 维护 方式 等 方面 ,获得 了 大 量 的 研究 。 在 研究 过 程 中 ， 
很 少 去 关注 设备 本 身 维 护 行为 的 具体 实施 ,有 时 还 假设 企业 的 维修 能 力 是 无 限 的 ， 
然而 ,在 企业 的 实际 生产 过 程 中 ,企业 的 维修 人 员 、 维 修 备件 .维修 能 源 及 工具 等 都 
不 是 无 限 的 ,这 就 造成 了 维护 策略 在 复杂 系统 中 很 难 进行 应 用 。 所 以 ,在 多 部 件 设 
备 维护 过 程 中 ,维护 资源 的 调度 也 是 不 可 忽略 的 。 

对 于 文献 中 考虑 多 部 件 设备 维护 的 分 析 , 设 备 的 维护 周期 是 已 知 量 或 者 假设 
是 固定 不 变 的 ,也 没 考虑 设备 发 生 停机 时 多 部 件 间 的 相关 性 。 实 际 上 ,多 部 件 间 的 
相关 性 决定 了 在 企业 制定 最 优 的 设备 维护 调度 策略 的 过 程 中 ,需要 将 多 部 件 间 的 
经 济 相 关 性 、 结 构 相 关 性 等 的 因素 综合 考虑 进去 。 所 以 ,本 书 考虑 了 设备 多 部 件 的 
维护 资源 及 多 部 件 间 的 相关 关系 ,针对 这 类 设备 的 维护 调度 进行 优化 研究 。 


2.7 退化 隐 半 马尔 可 夫 模 型 


HMM 的 随机 序列 遵循 马尔 可 夫 链 (markov chain,MC) ,一 个 MC 表示 一 个 
事件 序列 ,对 于 每 个 事件 , 它 的 发 生 概率 仅 依 赖 于 前 一 事件 。 在 HMM 过 程 中 , 事 
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件 是 与 概率 函数 相关 ,无 法 直接 观察 到 的 。 换 句 话 说 ,如 果 产 生 某 个 随机 状态 序 
列 , 相 应 地 就 会 出 现 一 个 观测 值 向 量 的 序列 。 每 一 个 观测 值 向 量 是 由 一 个 具有 相 
对 应 的 概率 密度 分 布 的 健康 状态 序列 所 产生 , 且 对 于 每 一 个 观测 值 向 量 ,每 种 健康 
状态 都 被 某 些 概率 密度 分 布 所 表示 。 这 就 说 明 , HMM 是 具有 一 定 状态 数量 的 隐 
MC 且 存 在 随机 函数 集 。 

对 于 HMM ,基本 的 构成 元 素 如 下 。 

CD. N: 模 型 中 的 状态 数量 ,对 于 状态 ,都 是 不 可 观察 的 ,我 们 利用 物理 信号 描述 
模型 的 状态 。 其 中 ,对 于 NN 个 状态 ,用 代 ,2,… ,NN} 来 表示 ,例如 ,时 间 1 的 状态 为 H,。 

(2) M: 表 示 每 个 状态 所 对 应 的 观测 值 数量 。 每 个 状态 的 观测 特征 可 以 表示 
为 V 二 {Vi,V,,…,Vum) ,在 时 间 1 的 观察 值 为 0,。 

(3)A :表示 状态 转移 概率 矩阵 ,表示 为 4 一 fa nx ue 

a; = P(Hm =j |H, =i) [Lij <N 
(4) B: 表 示 状 态 观 测 概率 的 分 布 , B 二 {0;(k)}wxm 表示 状态 i 的 观测 概率 分 布 。 
b;(k) = P(y | H, =i) ASIN A REM 
(5) r: 表 示 初 始 状态 分 布 ,r 一 {m mo ，… ,Tn)。 
m= P(H, =i) .1Si<N 

N,M,A,B 和 r 的 定义 描述 了 一 个 完整 的 HMM。 因 此 ,一 个 HMM 可 以 使 用 
参数 集 =(r,4,B,N,M) 来 描述 。 

在 HMM 中 ,用 概率 密度 函数 P(d) 来 说 明 设 备 健康 状态 的 驻 留 问题 。P(d) 
表示 设备 在 健康 状态 i 的 驻 留 时 间 为 a 的 概率 。 因 此 ,可 以 得 到 

Pi(d) = a$'!(1—ai) 

其 中 ,(1 一 oz) 表示 跳 到 另 一 个 状态 的 概率 ,az 表示 设备 停留 在 状态 ; 的 概率 。 然 
而 ,在 HMM 中 ,这 种 描述 状态 驻 留 时 间 的 方式 无 法 描述 设备 真实 的 状态 驻 留 情 
况 , 在 实际 状态 变化 中 ,会 出 现 不 符合 上 述 方程 的 情况 。HMM 在 建 模 中 ,存在 以 
下 三 个 实际 的 基本 问题 。 

A) 评估 基本 问题 (也 称 分 类 ): 给 定 参数 组 为 4 二 (x,A,B,N,M) 和 观察 序 
O=0, -0z s ,Or, 计 算出 现 观察 序列 的 概率 为 多 少 ( 即 P(O1X))。 

(2) 解码 基本 问题 (又 称 识别 ): 已 知 参数 组 为 4 二 (x,A,B,N,M) 和 观察 序 
O=O ,0 ,…,Or ,考虑 如 何 选择 一 个 最 优 的 状态 序列 。 

(3) 学 习 基 本 问题 (也 称 训练 ): 如 何 调整 模型 参数 4= (7,A,B,N,M)， 
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使 PCOIA) 最 大 化 。 

对 于 处 理 HMM 的 基本 问题 。 最 直接 的 方法 是 枚 举 法 , 换 句 话说 ,就 是 直接 列 
举 每 种 长 度 为 了 (观察 值 的 数量 ) 的 状态 序列 。 这 种 方法 具有 极 大 的 计算 量 , 并 且 ， 
也 无 法 获得 全 局 最 优 解 。 所 以 ,针对 HMM 的 分 类 问题 ,基于 动态 规划 模型 ,有 些 
研究 提出 了 前 后 向 算法 2*29 。HMM 的 解码 目的 是 发 现状 态 序列 ,这 些 状态 序列 
是 与 HMM 相对 应 的 ,在 已 知 观测 序列 时 ,发 现 单个 的 最 佳 状态 序列 是 HMM 最 
常用 的 优化 准则 ,因此 ,为 寻找 最 优 的 状态 序列 ,有 学 者 基于 动态 规划 理论 ,提出 了 
Viterbi) 算法 。 对 HMM 的 学 习 问 题 ,可 使 用 迭代 算法 Baum-Welch 算法 "1 来 
调整 模型 的 参数 4==(x,A,B,N,M) ,实现 PCO 1) 的 最 优化 。 

设备 在 持续 使 用 过 程 中 ,会 经 历 一 系列 不 同 的 健康 状态 ,最 终 到 达 其 故障 失效 
状态 。 例 如 ,液压 泵 的 使 用 过 程 显 示 , 液 压 泵 在 运转 过 程 中 ,有 如 下 四 个 过 程 :好 、 
中 等 . 较 差 恶劣。 因此 ,对 于 一 台 正 在 使 用 过 程 中 的 设备 ,对 于 它 的 健康 状态 ,会 
Zi n 个 不 相同 的 健康 状态 :h1( 健 康 状态 1) ,hs (健康 状态 2),…,h,-1( 健 康 状态 
n— 1) shy, ERRE n) 。 心 表示 设备 完全 失效 。 设 备 停留 在 健康 状态 hi 的 状态 驻 
留 时 间 为 4d; ,设备 的 全 寿命 长 度 为 TT。 则 

T= Yd 

与 HMM 中 ,状态 只 产生 一 个 观测 值 相 比 ,在 HSMM 中 ,状态 将 产生 一 个 片 
段 (Segment) 的 观测 值 , 称 Segment 为 HSMM 的 宏 状 态 。 对 于 每 个 宏 状 态 , 具 有 
相应 数量 的 单 状态 , 称 这 些 单 状 态 为 HSMM 的 微 状 态 。 假 设 HSMM 的 状态 演化 过 
程 中 ,包含 个 宏 状 态 (片段 ), 在 第 i 个 片段 结束 时 的 时 间 指 针 用 RRAS). 
图 2-6 描述 了 宏 状 态 、 微 状态 ,状态 的 驻 留 时 间 及 其 相互 之 间 的 关系 。 


One macro-state One macro-state 


Time units 
Observations 
States 


Durations 


Segments 
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针对 模型 中 的 第 i 个 宏 状 态 , 且 该 宏 状 态 的 观测 值 为 0; -1,…, Og» SEF 

HSMM 的 Segment 原理 ,观测 值 都 具有 一 样 的 宏 状 态 标 签 , 则 
sh = Sue = = $ = hy 

假设 设备 在 时 刻 1 时 的 健康 状态 为 5, ,观测 状态 序列 为 O。 则 HSMM 中 的 基 
本 参数 有 :初始 状态 概率 分 布 r, 状态 转移 概率 矩阵 A ,状态 持续 时 间 概 率 分 布 P， 
观测 值 概率 分 布 B. 健康 状态 的 数目 N 和 每 个 健康 状态 的 观测 值 数目 M ,对 于 
HSMM 来 说 ,用 4 二 (x,A4.P,B,N,M) 来 表示 它 的 基本 结构 。 对 于 片段 HSMM, 
具有 N 个 隐藏 不 可 直接 观测 的 状态 。A 代表 了 状态 间 的 转移 概率 ,a; 表示 状态 i 
到 j 的 转换 概率 。 假设 c= 0 时 ,健康 状态 是 so, 作 为 HSMM 过 程 的 开始 
(START). HSMM 的 宏 状 态 sy -sz 的 转换 是 符合 Markov 过 程 的 , 即 

PG, = j |s =i) = aj 

对 于 微 状 态 之 间 的 转移 (% -1 ms ) ,并 不 是 Markov 过 程 ,这 就 是 模型 是 半 马 尔 
FY X Gemi-Markov) ff) di? 。 在 semi-Markov 中 , 当 设 备 在 不 同 的 宏 状 态 之 间 
进行 转移 时 , 则 该 转换 过 程 就 是 Markov 过 程 。 

相对 于 HMM 来 说 ,观测 值 Segment 分 布 是 对 于 HSMM 的 一 个 发 展 。 当 设 
备 的 健康 状态 为 i 时 ,对 于 驻 留 时 间 为 d 的 观察 值 片段 LoCa 2) 的 观测 概率 为 
Poo 45 ]| Gd) (d =4s 一 4)。 与 HMM 相似 的 是 ,HSMM 也 具有 以 上 提 到 的 三 
个 基本 问题 需要 解决 。 

为 了 建立 设备 的 在 线 健康 预测 模型 ,对 HSMM 的 前 向 一 后 向 算法 进行 了 修 
正 。 首 先 ,对 于 表示 产生 观察 值 o ,0;,…,o0, 且 于 状态 i 结束 的 概率 的 前 向 变量 
a, (i) WEE XL. 

N min(D,1) 


a, (i) = PG 0) ,,o,|202 = >) >) aGagp(d|jb;(Otaa) (2-4) 


其 中 ,D 为 最 大 状态 持续 时 间 ; bi (Oran) 为 Or-a +1 *0i—a +2 re MIRR STE 
所 以 ,在 HSMM 中 ,对 于 产生 观测 序列 O 的 概率 ,可 以 表示 为 


PO|»- Dari) 
参考 前 向 变量 ,后 向 变量 为 


N min(D,t) 


BG) = >) >) agp (| jb ORD Ba G) (2-5) 


j=1 d=1 


为 进行 改进 HSMM 中 的 变量 估计 ,三 个 前 向 一 后 向 变量 被 重新 定义 : 
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aif (ivf) = Ploi ors = quis = ist” = quas; = fA) (2-6) 








D 
par sf) = >)[P(d = t — t| D POL |t = qus = ist” = qaos; = jl] 
d=1 


(2-7) 
grap = P(t =g = ist’ = (2-8) 
其 中 , Oha = owmiomz.…0t » OF = 010:...07 + but (i,j) 表示 在 状态 i 持续 了 d 
个 时 间 单 位 后 转换 到 了 下 一 状态 j 的 概率 。 
基于 式 (2-7) ,可 获得 出 iv Gj) «ac GO MSE (i,j) 的 表达 式 : 








ane (197) = a, (i)Nasyper (isj) (2-9) 
N D 
aj) = >) DEP = ( 2 t| Da G2] (2-10) 
i=] d=1 R 
Da (ag gue (iB G) 
Er sj) a=) (2-11) 








Bo (i = START) 
则 前 向 算法 的 基本 流程 为 
第 一 步 : 初 始 化 (41 二 0) 
1 # i = START 
0 否则 
8 — 3p HEAT AU I] 338 08 (70 £9 1.2. T) JE B1 ED; 1<i,j<N. 


Quo (i) = 








D 
dur sf) = > [PCd = t t| DPO |t = qs = ist! = quss; = jl] 
d=1 


ane (isj) = a Gas). Gj) 


N D 
a) = >) EP = ( — t| pane G5] 


i=1 d=1 
则 后 向 算法 的 基本 流程 为 以 下 步 又。 
BAG Witte a- T asi jm) 
BrG) =1 
第 二 步 ET 1 BVA 07700 1.2. 7 T) ER 1d D; 1i jN. 


N min(D,1) N 
BG = >) 2) asp (dl Do OLD Bua = Plagder Guo GO 
j=l d=1 j=l 


D 
Malay pur DRD 
&, Gj) = t 
BG = START) 
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则 前 向 一 后 向 算法 的 计算 复杂 度 为 OON2DT) ,其 中 , D= DD, . 


基于 式 (2-4) 一 式 (2-11) ,可 得 初始 状态 概率 分 布 r, 状 态 转移 概率 矩阵 A 和 观 
测 值 概率 分 布 B 的 重 估 公式 。 


D 
m [X Ai) Pd | (Of) | 
元 am d=1 








POJA 
T 
Mas Gp 
aj — —T E N 
yer Gp) 
1-1 i=] j=1 
» bur GJ) 
a,(i)| 2 . BOD 
= eres 
d=1 
= = sL0 = E 
b, CR) a ED (2-12) 
a,(i)| 2 ; B. GO 
= Sed 一 了 一 :| | 


对 于 设备 健康 状态 的 驻 留 时 间 重 估 公 式 , 设 备 在 状态 i 下 的 持续 时 间 均 值 
p GO (88528 COME SERI T : 
T T 1 





LE 

一 = py? /2 
e EE COn GI *1(q,—q,a) 
2,4 719,79, 4 2xc 


BG) Nv (2-13) 








1 e EE Cay a 07) 3 
2,473,744 V 210 
b» T 1 $ 
2 

- - —p} 2/2 > 

= ECC, 074 (d qi) 
3 2, 12, 79, "o r 
#(i)= = 天 一 到 gê (i) (2-14) 





1 

2,471,72,, VTO 

设备 的 健康 预测 包括 设备 的 健康 诊断 和 健康 预测 。 健 康 诊 断 是 指 用 数据 训练 

HSMM ,识别 出 在 特定 的 失效 模式 下 设备 的 个 不 同 的 健康 状态 。 因 此 ,本 节 会 

设计 一 个 诊断 模型 用 作 设 备 健康 状态 的 识别 操作 。 在 故障 诊断 方面 ,针对 设备 的 

每 一 个 故障 类 型 ,建立 相应 的 HSMM 进行 描述 。 除 此 之 外 ,针对 设备 的 正常 状 

态 , 也 有 一 个 HSMM 来 表示 。 针 对 nn 组 设备 观测 序列 ,为 了 描述 每 个 设备 的 观测 
值 ,建立 个 不 同类 型 的 HSMM ,其 中 .每 个 设备 观测 值 描述 了 相应 的 状态 。 

在 已 知 设备 观测 序列 的 条 件 下 ,利用 HSMM 原理 ,识别 设备 的 失效 状况 。 针 


ETELE Cay ayy Du} 61 
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Xt FE DUI BRAY nA HSMM ,对 于 其 中 的 每 个 HSMM ,描述 相同 的 状态 序列 。 根 据 
最 大 似 然 函数 的 值 ,完成 对 序列 的 分 类 。 在 HSMM 的 故障 诊断 与 寿命 预测 的 示 
意图 2-7 中 ,表示 了 HSMM 的 训练 阶段 .故障 诊断 阶段 及 寿命 预测 阶段 。 

设备 的 健康 状态 转换 点 是 将 设备 从 健康 状态 hi; 转换 到 健康 状态 有 ;+i 时 的 时 刻 
点 。 对 于 进行 健康 状态 转换 点 的 诊断 ,是 在 设备 的 当前 健康 状态 下 ,估计 距离 健康 
状态 转换 点 的 时 间 值 。 对 于 设备 从 h; 到 hi 发 生 转 移 中 对 应 的 状态 转换 点 ,根据 
下 列 步骤 进行 识别 :在 获得 新 的 观测 值 序列 m ,… ,0,,… 时 ,在 线 执行 HSMM 的 
Viterbi 算法 ,如 果 状 态 ,三 hi+1 是 在 设备 当前 最 可 能 的 状态 序列 中 ,在 这 种 情况 
下 ,时 刻 1 就 代表 健康 状态 转换 点 。 

针对 HSMM 中 的 每 一 个 状态 序列 ,可 以 获得 每 个 健康 状态 的 转换 点 的 估 值 。 
比如 ,针对 状态 sO SAEZ 1 代表 了 健康 状态 转换 点 的 位 置 。 因 此 ,针对 设备 健康 状 
态 转换 点 的 估 值 ,表示 为 

t'e = $C PG? |O) 


X T 
由 于 PGa-1O = PG |O =PG® |o + D PG |O =PG® |O)+ 
v=l 


=H 


PG, = LO) 

可 得 

te = ihe “。[P( = 2|O)— PG, = 1|0)]) (2-15) 

对 于 权重 处 理 后 的 均值 可 以 使 惩罚 函数 2 PG [O) (ye — 0,0? 达到 最 小 化 。 
其 中 ,表示 了 状态 转换 点 。 基 于 HSMM 的 前 、 后 向 算法 ,该 估计 值 可 以 被 获得 。 

对 设备 进行 健康 预测 ,可 以 获得 设备 的 状态 变化 情况 以 及 预测 设备 的 剩余 寿 
命 ,也 可 获得 设备 的 状态 转换 点 。 基 于 式 (2-13) 和 式 (2-14) ,每 个 宏 状 态 驻 留 时 间 
都 可 以 被 获得 , 则 状态 的 持续 时 间 为 


Dh) = phi) + po? Chi) (2-16) 
L-1 L-1 

p= (T— Puh dye h) (2-17) 
i=0 1-0 


该 状态 持续 时 间 的 取 值 可 以 使 logP(CS | A. T) = Sra, | he) 取 值 最 大 ,同时 
满足 条 件 : T= S pao 5 
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振动 数据 (数据 预 处 理 


特征 抽取 (通过 小 波 
技术 ) 


模型 参数 估计 (针对 每 一 健康 状 模型 参数 估计 (利用 设备 的 全 生 
态 ， 利 用 健康 状态 训练 数据 对 命 周期 训练 数据 对 HSMM 进 行 
HSMM 进 行 训练 ) 


训练 过 程 








HSMM,(2,) 


传感器 信号 


对 数 似 然 什 
计算 (P) 








HSMM,(2,) 


mE "m 设备 健康 状况 =i 





























对 数 似 然 值 
计算 (P,) 


2-7 基于 HSMM 的 设备 健康 预测 框架 


2.8 本 章 小 结 


本 章 尝试 对 现 有 文献 中 研究 的 预测 理论 和 技术 进行 了 综述 工作 ,所 涉及 的 理 
论 方法 都 服务 于 CBM 系统 。 由 于 工业 制造 设备 和 系统 的 日 益 复 杂 ,维护 管理 日 益 
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显现 出 其 重要 性 ,维护 成 本 也 相应 地 大 幅 增 长 ,因此 服务 于 维护 策略 的 能 得 到 精确 
预测 结果 的 工具 引起 了 越 来 越 多 的 关注 。 在 其 他 领域 ,如 模式 识别 、 医 疗 预 测 等 ， 
得 到 成 功 运 用 的 技术 和 方法 也 被 引入 设备 预测 领域 中 来 ,许多 学 者 对 这 些 理论 进 
行 了 修改 ,使 之 更 适用 于 工业 应 用 。 从 文献 的 整理 综述 过 程 中 可 以 看 到 三 个 增长 
明显 的 研究 趋势 。 

CD 对 来 自传 感 器 的 数据 进行 提取 处 理 后 可 以 得 到 众多 的 诊断 指标 ,对 这 些 
指标 进行 分 析 可 以 推测 设备 的 运行 状况 。 但 没有 一 个 指标 能 够 完整 地 描述 所 有 类 
型 的 故障 。 为 了 准确 且 可 靠 地 预测 设备 的 有 效 剩余 寿命 ,必须 同时 综合 考虑 多 个 
诊断 指标 ,使 用 单 参数 预测 模型 很 难 充 分 完整 地 描述 不 同类 型 的 故障 及 设备 在 故 
障 中 的 不 同 发 展 阶段 。 作 为 非 参数 模型 的 人 工 神经 网 络 , 擅 长 处 理 多 变量 趋势 的 
分 析 问 题 ,并 在 多 参数 故障 预测 方面 得 到 了 众多 关注 ,具有 很 好 的 研究 和 应 用 
前 景 。 

(2) 越 来 越 多 的 学 者 偏好 设计 组 合 模 型 来 进行 数据 提取 、 数 据 处 理 和 建 模 工 
作 。 组 合 预 测 模型 具有 信息 利用 充分 、 精 度 高 等 特点 ,因而 受到 广泛 的 重视 ,成 为 
研究 热点 之 一 。 从 简单 的 启发 式 模型 到 复杂 的 采用 人 工 智能 知识 的 神经 网 络 模 
型 ,各 类 方法 都 有 它们 自身 特有 的 优点 和 缺点 。 从 只 采用 单一 理论 或 方法 的 模型 
中 很 难 获得 令 人 满意 的 结果 ,而 如 何 设计 一 个 能 提供 高 精确 度 的 预测 结果 的 模型 
具有 极 大 的 挑战 性 。 一 个 设计 优秀 的 组 合 模型 通常 将 两 种 或 更 多 的 技术 、 理 论 运 
用 到 对 系统 进行 建 模 的 工作 中 ,这 些 理论 的 相互 合作 可 以 消除 或 减少 单个 理论 的 
缺点 ,利用 各 个 理论 的 优点 ,使 模型 能 够 更 好 地 运作 。 从 另 一 个 方面 来 看 ,如 何 选 
择 适当 的 方法 并 将 它们 有 效 地 结合 起 来 ,使 其 "扬长 避 短 ”地 在 建 模 过 程 中 互相 协 
作 , 也 是 一 个 非常 有 挑战 性 的 问题 。 目 前 ,把 不 同 预测 方法 的 结果 加 权 秋 加 的 线性 
组 合 预 测 模型 已 趋 于 成 熟 , 针 对 传统 的 非 线 性 组 合 预测 模型 存在 的 不 足 , 人 工 神 经 
网 络 作为 “组 合 器 ”被 引入 组 合 预测 模型 。 许 多 研究 将 神经 网 络 和 其 他 的 一 些 数据 
处 理 方法 ,如 专家 系统 .模糊 逻辑 灰色 系统 GM(1,1) 等 ,结合 起 来 建 模 。 通 过 实 
际 数据 的 检验 ,可 以 看 到 这 些 组 合 的 “ 黑 盒子 ?模型 能 够 输出 比较 理想 的 结果 。 隐 
式 马尔 可 夫 模 型 和 隐 式 半 马 尔 可 夫 模 型 是 近来 新 被 引入 预测 领域 的 方法 。 至 今 为 
止 ,如 何 采用 隐 式 马尔 可 夫 模 型 和 隐 式 半 马 尔 可 夫 模 型 进行 预测 的 研究 仍 处 于 启 
蒙 阶段 。 和 其 他 * 黑 盒子 "模型 不 同 , 马 尔 可 夫 链 相关 的 模型 有 一 个 相对 清晰 的 预 
测 处 理 过 程 。 文 献上 设计 了 一 个 SVM-HMM 模型 ,将 矢量 支持 向 量 机 和 隐 式 马 
尔 可 夫 模 型 相 结 合 来 鉴别 非 稳 定时 间 序 列 的 发 生 ,此 类 时 间 序 列 暗示 设备 正 处 于 
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显现 出 其 重要 性 ,维护 成 本 也 相应 地 大 幅 增 长 ,因此 服务 于 维护 策略 的 能 得 到 精确 
预测 结果 的 工具 引起 了 越 来 越 多 的 关注 。 在 其 他 领域 ,如 模式 识别 、 医 疗 预 测 等 ， 
得 到 成 功 运 用 的 技术 和 方法 也 被 引入 设备 预测 领域 中 来 ,许多 学 者 对 这 些 理论 进 
行 了 修改 ,使 之 更 适用 于 工业 应 用 。 从 文献 的 整理 综述 过 程 中 可 以 看 到 三 个 增长 
明显 的 研究 趋势 。 

CD 对 来 自传 感 器 的 数据 进行 提取 处 理 后 可 以 得 到 众多 的 诊断 指标 ,对 这 些 
指标 进行 分 析 可 以 推测 设备 的 运行 状况 。 但 没有 一 个 指标 能 够 完整 地 描述 所 有 类 
型 的 故障 。 为 了 准确 且 可 靠 地 预测 设备 的 有 效 剩余 寿命 ,必须 同时 综合 考虑 多 个 
诊断 指标 ,使 用 单 参数 预测 模型 很 难 充 分 完整 地 描述 不 同类 型 的 故障 及 设备 在 故 
障 中 的 不 同 发 展 阶段 。 作 为 非 参数 模型 的 人 工 神经 网 络 , 擅 长 处 理 多 变量 趋势 的 
分 析 问 题 ,并 在 多 参数 故障 预测 方面 得 到 了 众多 关注 ,具有 很 好 的 研究 和 应 用 
前 景 。 

(2) 越 来 越 多 的 学 者 偏好 设计 组 合 模 型 来 进行 数据 提取 、 数 据 处 理 和 建 模 工 
作 。 组 合 预 测 模型 具有 信息 利用 充分 、 精 度 高 等 特点 ,因而 受到 广泛 的 重视 ,成 为 
研究 热点 之 一 。 从 简单 的 启发 式 模型 到 复杂 的 采用 人 工 智能 知识 的 神经 网 络 模 
型 ,各 类 方法 都 有 它们 自身 特有 的 优点 和 缺点 。 从 只 采用 单一 理论 或 方法 的 模型 
中 很 难 获得 令 人 满意 的 结果 ,而 如 何 设计 一 个 能 提供 高 精确 度 的 预测 结果 的 模型 
具有 极 大 的 挑战 性 。 一 个 设计 优秀 的 组 合 模型 通常 将 两 种 或 更 多 的 技术 、 理 论 运 
用 到 对 系统 进行 建 模 的 工作 中 ,这 些 理论 的 相互 合作 可 以 消除 或 减少 单个 理论 的 
缺点 ,利用 各 个 理论 的 优点 ,使 模型 能 够 更 好 地 运作 。 从 另 一 个 方面 来 看 ,如 何 选 
择 适当 的 方法 并 将 它们 有 效 地 结合 起 来 ,使 其 "扬长 避 短 ”地 在 建 模 过 程 中 互相 协 
作 , 也 是 一 个 非常 有 挑战 性 的 问题 。 目 前 ,把 不 同 预测 方法 的 结果 加 权 秋 加 的 线性 
组 合 预 测 模型 已 趋 于 成 熟 , 针 对 传统 的 非 线 性 组 合 预测 模型 存在 的 不 足 , 人 工 神 经 
网 络 作为 “组 合 器 ”被 引入 组 合 预测 模型 。 许 多 研究 将 神经 网 络 和 其 他 的 一 些 数据 
处 理 方法 ,如 专家 系统 .模糊 逻辑 灰色 系统 GM(1,1) 等 ,结合 起 来 建 模 。 通 过 实 
际 数据 的 检验 ,可 以 看 到 这 些 组 合 的 “ 黑 盒子 ?模型 能 够 输出 比较 理想 的 结果 。 隐 
式 马尔 可 夫 模 型 和 隐 式 半 马 尔 可 夫 模 型 是 近来 新 被 引入 预测 领域 的 方法 。 至 今 为 
止 ,如 何 采用 隐 式 马尔 可 夫 模 型 和 隐 式 半 马 尔 可 夫 模 型 进行 预测 的 研究 仍 处 于 启 
蒙 阶段 。 和 其 他 * 黑 盒子 "模型 不 同 , 马 尔 可 夫 链 相关 的 模型 有 一 个 相对 清晰 的 预 
测 处 理 过 程 。 文 献上 设计 了 一 个 SVM-HMM 模型 ,将 矢量 支持 向 量 机 和 隐 式 马 
尔 可 夫 模 型 相 结 合 来 鉴别 非 稳 定时 间 序 列 的 发 生 ,此 类 时 间 序 列 暗示 设备 正 处 于 
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异常 状态 或 者 正在 偏离 正常 运作 状态 。 在 未 来 的 研究 中 ,对 此 类 隐 式 或 隐 式 半 式 
马尔 可 夫 组 合 模型 值得 进行 更 多 的 研究 ,并 设计 出 理想 的 设备 健康 状态 预测 模型 。 

(3) 许多 “新 ”理论 和 方法 被 引入 ,用 于 设备 健康 的 预测 问题 。 这 些 理论 和 方 
法 大 多 曾 在 别 的 领域 得 到 过 成 功 运 用 ,如 灰色 模型 .马尔 可 夫 链 等 。 这 些 “ 新 ”理论 
方法 在 数据 处 理 和 分 析 方 面 有 它们 特有 的 优势 ,有 效 减少 了 计算 复杂 度 , 增 加 了 预 
测 精确 度 。 

目前 ,在 CBM 的 研究 领域 中 ,预测 仍旧 是 一 个 相对 较 新 的 研究 课题 。 在 已 有 
文献 的 预测 模型 中 ,存在 如 下 的 一 些 不 足 。 

(1) 大 多 数 研究 都 限制 在 某 个 特定 领域 内 ,缺少 通用 性 。 已 有 的 设备 健康 状 
态 的 预测 方法 /算法 大 多 具有 其 特定 的 应 用 领域 。 

(2) 搜集 大 量 充足 的 数据 不 仅 困难 ,而 且 成 本 高 昂 。 许 多 模型 的 数据 训练 和 
算法 都 要 求 在 拥有 大 量 历史 数据 的 基础 上 进行 ,而 这 些 数据 不 仅 包括 了 传感器 在 
设备 普通 状态 下 捕捉 到 的 数据 ,还 需要 故障 状态 下 的 数据 ,甚至 破坏 系统 /组 件 而 
得 到 的 损毁 数据 ,要 得 到 这 些 数据 不 仅 代价 高 昂 , 而 且 需 要 相当 长 的 数据 搜集 
时 间 。 

G) 目前 大 部 分 各 类 所 谓 的 “实时 ?维护 系统 ,只 是 将 传感器 搜集 到 的 数据 用 
作 诊 断 和 预测 模型 的 实时 输入 数据 ,模型 本 身 通 常 不 具有 采用 在 线 的 实时 数据 进 
行 更 新 的 能 力 。 这 些 静 态 的 训练 数据 会 降低 模型 预测 和 诊断 结果 的 精确 度 。 可 以 
考虑 将 一 些 能 够 完成 快速 运算 的 方法 纳入 模型 的 设计 中 ,以 达到 在 线 更 新 模型 的 
目的 。 

(4) 缺少 对 预测 的 准确 性 和 精确 度 进行 评判 的 标准 ,缺少 统一 的 考核 标准 来 
评价 和 比较 各 种 预测 方法 。 

(5) 已 有 的 大 部 分 研究 仍 停留 在 理论 阶段 ,很 少 有 文献 已 成 功 应 用 于 实际 应 
用 中 

在 已 有 预测 模型 中 ,以 上 普遍 存在 的 弱点 导致 了 模型 的 长 学 习 周 期 .长 执行 时 
间 的 问题 ,因此 在 实际 应 用 中 价值 不 大 。 大 致 来 说 ,未 来 用 于 CBM 系统 中 的 预测 
技术 存在 以 下 可 能 的 研究 方向 :@ 针 对 系统 退化 预测 和 有 效 剩 余 寿 命 的 不 确定 性 ， 
建立 有 效 完全 的 评估 体系 和 管理 方法 ;@ 为 了 提高 预测 精度 ,可 以 在 决策 系统 中 建 
立 预 测 结果 的 处 理 方法 与 择优 规则 。 例 如 , 当 模型 计算 出 有 效 剩 余 寿 命 估 值 的 概 
率 时 ,最 好 能 同时 给 出 预测 值 与 真实 剩余 寿命 值 间 的 误差 范围 ,而 且 可 以 对 预测 值 
进行 处 理 和 选择 ,使 其 能 更 有 效 地 应 用 于 维护 决策 的 制定 中 。 同 时 ,这 些 新 引入 的 
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预测 理论 和 方法 需要 更 多 地 应 用 到 实际 中 ,来 证 明 它 们 的 有 效 性 。 相 较 那 些 具 有 
领域 特殊 性 的 模型 而 言 ,应 鼓励 更 多 通用 性 强 的 系统 性 模型 被 改造 引用 到 快速 发 
展 变 化 的 工业 界 中 来 。 

另 一 个 研究 趋势 是 如 何 将 预测 技术 用 于 设备 维护 策略 的 制定 中 。 对 设备 失效 
时 间 的 准确 预测 可 以 帮助 建立 更 高 效 的 设备 更 换 和 备件 库存 管理 制度 。 图 2-8 描 
述 了 一 个 系统 性 的 设备 维护 框架 ,在 实时 诊断 与 预测 信息 的 基础 上 ,可 以 更 加 高 效 
率 、 低 成 本 地 进行 维护 运作 。 


(aun) 特征 提取 
D i r = | ! 
zeera WD | 





- $ 
mE S 
L4 
验证 a - 
Bil. 故障 时 间 一 -5 oa 
E 
[e | 


2-8 维护 决策 的 系统 性 框架 
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设备 在 生产 运转 过 程 中 , 随 着 时 间 的 增加 ,会 出 现 设备 健康 状态 的 衰退 。 因 
此 ,基于 设备 的 衰退 信息 ,识别 设备 的 健康 状态 变化 趋势 及 计算 剩余 有 效 寿 命 , 有 
助 于 设备 采取 合理 的 维护 措施 。 在 设备 的 健康 状态 恶化 前 ,对 设备 进行 维护 修理 ， 
可 以 避免 设备 大 的 维护 ,降低 设备 的 故障 率 和 设备 的 维护 成 本 ,提高 设备 的 利用 率 
和 企业 的 生产 效率 。 为 了 建立 更 好 的 设备 维护 模型 ,本 童 介绍 设备 的 单 监测 信息 
的 在 线 健康 预测 模型 ,以 及 剩余 寿命 与 健康 状态 之 间 的 关系 。 

基于 健康 预测 的 设备 维护 决策 ,主要 包括 数据 采集 、 数 据 处 理 和 维护 策略 优 
化 。 维 护 策略 的 优化 涉及 设备 的 诊断 及 其 预测 两 方面 的 内 容 。 设 备 的 健康 预测 更 
好 地 描述 了 设备 的 健康 状态 与 趋势 ,从 而 影响 设备 的 有 效 维护 策略 的 建 模 。 

当前 ,设备 的 健康 预测 方法 主要 有 四 类 :基于 物理 模型 的 方法 、 基 于 数据 驱动 
的 方法 、 基 于 模型 驱动 的 方法 和 基于 信息 融合 的 方法 。 基 于 物理 模型 的 方法 很 难 
描述 一 个 设备 衰退 的 趋势 与 详细 的 建 模 过 程 ,并 且 , 需 要 对 设备 进行 停机 处 理 , 在 
设备 的 生产 运转 过 程 中 ,这 是 不 允许 的 。 基 于 数据 驱动 的 设备 健康 预测 方法 ,这 类 
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方法 具有 两 个 比较 大 的 缺陷 :非常 慢 的 收敛 性 及 容易 陷入 局 部 最 优 解 。 由 于 数据 
驱动 的 原因 ,这 些 模型 具有 很 高 的 计算 复杂 性 ,容易 造成 计算 爆炸 问题 ,这 些 缺 陷 
限制 了 这 些 方法 的 应 用 和 发 展 。 基 于 模型 驱动 的 设备 健康 预测 方法 ,这 类 方法 的 
识别 和 训练 过 程 需要 耗费 较 长 的 时 间 , 不 适合 设备 在 线 的 健康 预测 ,因此 ,这 类 模 
型 常用 于 离线 健康 预测 。 针 对 这 类 方法 的 离线 特性 ,本 章 建 立 了 设备 单 监测 信息 
的 在 线 健康 预测 模型 。 

在 本 章 建 模 中 ,HMM 是 一 个 双重 的 随机 过 程 模型 ,而 且 , 对 于 设备 各 个 健康 
状态 ,它们 之 间 的 演化 也 具有 随机 性 ,设备 状态 中 观测 到 的 数据 信息 是 随机 的 。 这 
就 说 明了 ,对 于 HMM 的 真实 状态 ,是 不 能 被 直接 观测 的 ,是 隐藏 的 ,通过 数据 的 有 
效 处 理 与 分 析 来 推测 设备 的 真实 状态 。 设 备 在 使 用 过 程 中 的 状态 识别 与 检测 ,是 
不 能 发 现 设备 的 真实 状态 的 ,可 以 利用 来 自传 感 器 的 监测 信息 进行 推断 设备 的 健 
康 状 态 。 对 于 HMM 在 设备 中 的 状态 监测 .识别 与 预测 ,存在 一 些 研 究 ,并 获得 了 
不 错 的 效果 [5 29 。 

由 于 HMM 的 状态 驻 留 时 间 是 遵循 指数 分 布 的 ,因而 模型 中 的 时 间 结 构 不 能 
被 详细 准确 地 描述 ,这 是 HMM 的 一 个 内 在 局 限 性 。 对 于 这 个 问题 ,在 文献 中 
中 ,连续 的 HMM 被 应 用 于 语音 识别 领域 。 并且, 改进 后 的 HMM 模型 对 于 语音 
识别 的 误差 率 降低 了 一 半 。 从 而 证 明了 ,系统 的 识别 性 能 也 可 以 得 到 极 大 提 
高 9** 归 。 在 设备 的 诊断 领域 ,文献 中 将 HMM 方法 引入 设备 的 健康 预测 和 诊断 
中 。 将 设备 所 经 历 的 所 有 健康 状态 分 别 建立 并 训练 对 应 的 HMM。 假 设 训 练 好 的 
所 有 HMM 之 间 的 状态 转移 时 间 遵 循 特 定 的 多 变量 分 布 ,可 用 向 量 进行 估 值 。 当 
确定 状态 的 分 布 函数 后 ,如 果 给 定 设备 的 前 一 个 健康 状态 ,也 可 以 随 之 获得 设备 转 
移 到 另 一 个 健康 状态 的 条 件 概率 分 布 。 之 前 ,有 一 部 分 学 者 把 HMM 引入 诊断 预 
HY if So 28227) 。 在 这 些 应 用 中 ,仍然 受 HMM 固有 局 限 性 的 约束 。 让 HMM 无 
法 对 设备 真实 的 情况 做 出 具有 高 准确 度 的 建 模 , 从 而 造成 了 其 预测 和 诊断 结果 的 
可 靠 度 是 不 高 的 。 因 此 ,为 了 克服 因 马 尔 可 夫 链 的 假设 所 造成 的 HMM 的 局 限 性 ， 
在 HMM 的 结构 上 加 入 了 时 间 部 分 ,衍生 出 了 HSMM 方法 。 

本 章 针对 HSMM 的 特点 ,构建 单 监测 信息 的 在 线 健康 预测 方法 ,在 线 获 得 
设备 的 每 个 健康 状态 的 演化 规律 。 设 备 的 每 个 健康 状态 对 应 HSMM 中 的 一 个 
片段 。 通 过 训练 好 的 在 线 算 法 对 设备 的 故障 进行 分 类 和 对 设备 的 剩余 寿命 进行 
预测 。 在 线 HSMM 经 过 训练 后 ,还 可 以 估计 每 个 健康 状态 的 驻 留 时 间 。 一 个 基 
于 在 线 HSMM 宏观 状态 的 预测 方法 可 以 使 用 持续 时 间 的 估 值 来 预测 设备 的 有 
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效 剩余 寿命 。 与 已 有 的 文献 相 比 ,本 章节 提出 了 单 监测 信息 的 设备 在 线 健康 预 
测 框 架 。 


3.2 设备 在 线 健 康 预 测 方法 


对 于 设备 的 健康 预测 ,将 健康 状态 之 间 的 转移 关系 和 每 个 健康 状态 的 驻 留 信 
息 作 为 健康 预测 模型 的 输入 ,预测 设备 的 健康 状态 发 展 趋势 和 计算 设备 的 剩余 寿 
命 有 效 值 。 通 过 健康 预测 算法 可 以 获得 HSMM 的 参数 值 ,其 中 ,根据 观察 值 和 健 
康 状态 的 轨迹 ,可 以 估计 每 个 健康 状态 的 状态 驻 留 值 。 在 本 节 中 ,主要 描述 了 设备 
单 监测 信息 的 在 线 健康 预测 方法 。 

首先 ,基于 HSMM 方法 和 SMC 方法 ,提出 了 一 个 新 颖 的 单 监测 信息 在 线 健 
康 状态 识别 算法 。 其 次 ,将 利用 传感器 收集 的 设备 监测 数据 作为 提出 方法 的 输入 
值 , 随 着 不 断 获得 的 设备 状态 信息 ,发 展 了 新 的 在 线 剩 余 寿命 预测 方法 ,主要 目的 
就 是 应 用 SMC 方法 ,获得 联合 多 步 向 前 健康 状态 识别 算法 。 最 后 ,描述 了 设备 的 
在 线 健康 预测 流程 。 

提出 的 在 线 健 康 预 测算 法 主要 包含 两 个 过 程 ( 见 图 3-1) 。 对 设备 的 健康 预测 
来 说 ,学 习 阶段 ( 即 离线 阶段 ) 将 产生 一 个 合适 的 健康 预测 模型 ,在 线 阶 段 将 识别 设 
备 当 前 的 健康 状态 和 预测 设备 的 剩余 寿命 。 模 型 的 第 一 个 阶段 主要 是 指 模型 的 离 
线 阶 段 , 处 理 来 自传 感 器 的 设备 状态 监测 数据 ,用 来 训练 HSMM。 模 型 的 第 二 个 
阶段 主要 是 模型 的 在 线 阶 段 ,利用 新 方法 来 在 线 识 别 设备 的 当前 健康 状态 ,并 且 计 
算 相 应 的 设备 剩余 寿命 。 


3.2.1 数据 预 处 理 及 特征 提取 


为 了 验证 模型 的 有 效 性 ,需要 对 设备 进行 监测 ,经 过 传感器 采集 或 人 工 采集 的 
设备 监测 数据 不 一 定 能 直接 用 于 后 续 的 数据 分 析 和 数据 输入 ,如 果 直 接 用 于 模型 
分 析 ,将 会 影响 后 续 模 型 分 析 过 程 的 有 效 性 和 应 用 性 。 因 而 ,在 验证 模型 的 有 效 性 
时 ,对 监测 的 设备 原始 数据 进行 预 处 理 , 就 显得 十 分 重要 。 根 据 小 波 变换 的 方法 ， 
对 原始 监测 数据 进行 有 效 的 预 处理 , 将 预 处 理 后 的 数据 作为 模型 的 输入 ,进行 模型 
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图 3-1 基于 HSMM 和 SMC 方法 的 健康 预测 框架 


分 析 , 验 证 模型 的 实用 性 和 有 效 性 。 
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数据 预 处 理 算法 包括 特征 提取 和 矢量 量化 。 首 先 描述 检测 数据 的 特征 提取 。 
由 于 系统 的 每 部 分 结构 是 不 同 的 ,所 以 当 一 个 系统 发 生 故 障 时 ,经 常会 产生 大 量 的 
非 稳 态 信号 。 在 每 一 个 频带 ,输出 信号 的 性 能 是 不 同 的 ,小 波 分 析 方 法 可 以 自动 地 
把 不 同 频率 信号 分 解 成 不 同 的 频带 ,这 样 可 以 增加 时 间 一 频率 分 辩 率 ,并 实现 设备 
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故障 特征 提取 。 利 用 小 波 变 换 的 故障 特征 提取 算法 描述 如 下 。 

CD 监测 的 振动 信号 被 分 解 为 V- 层 的 小 波 信号 ,分 别提 取 从 V- 层 信号 的 低频 
到 高 频 的 2” 个 频带 的 小 波 系数 (X;(j 二 1,2,…,2"))。 

(2) 重建 小 波 包 系数 和 提取 每 个 频带 的 信号 S; G — 1.2.27). 

G) 计算 每 个 频带 信号 的 总 能 量 ,计算 公式 如 下 : 


E, =| 1$, | de = >) | za |? 
k=1 
其 中 ,zx (j= 二 1,2,… ,2Y ,k 二 1,2,…,n) ,重建 信号 离散 点 的 振幅 。 
(4) 根据 下 列 方程 ,建立 和 标准 化 特征 向 量 
2V 
E- c» | E, [21/2 
j=1 
因此 ,特征 向 量 下 等 于 F'( 即 ,F'=(E,E,,*…,E,")/E)。 


当 小 波 故障 特征 向 量 作为 HSMM 的 输入 值 时 ,特征 向 量 必须 标准 化 。 自 组 
织 特征 映射 (Self-organization map,SOM) 常 用 于 进行 向 量 的 矢量 量化 ,SOM 主要 


模拟 了 大 脑 神经 系统 的 自 组 织 特征 映射 的 功能 , 它 是 一 个 有 竞争 力 的 学 习 网 络 与 
无 监督 和 自 组 织 学 习 过 程 。 


3.2.2 在 线 健康 预测 算法 


本 章 的 主要 目的 是 为 连续 时 间 函 数 的 单 监测 信息 的 实时 健康 状态 识别 和 剩余 
寿命 预测 提供 合适 的 算法 。 因 此 ,基于 SMC 方法 ,一 种 新 颖 的 识别 算法 被 应 用 
于 解决 HSMM 的 识别 问题 。 目 前 ,对 于 HSMM ,主要 关注 的 内 容 有 两 个 方面 : 
中 通过 估计 概率 分 布 p Ges | yi.,-1) 的 一 步 向 前 状态 识别 算法 ;加 通过 估计 概率 
分 布 p(z+sly1.n-1) 的 多 步 向 前 健康 状态 识别 方法 。 然 而 ,由 于 忽略 了 HSMM 
的 一 致 性 原则 ,p(x | yw- 和 za-i) 的 健康 状态 识别 路 径 不 是 非常 准 
确 。 在 健康 状态 识别 中 ,连续 性 原则 是 非常 重要 的 。 并 且 , 对 于 在 线 健 康 状 态 识 
别 , 连 续 性 原则 也 是 必须 遵循 的 和 非常 重要 的 。 因 此 ,基于 联合 概率 分 布 
DG, sea na iO ,提出 了 一 种 新 颖 的 联合 多 步 向 前 健康 状态 识别 算法 ,遵循 连续 
性 的 识别 路 径 ,该 方法 提供 了 最 准确 的 健康 状态 的 识别 。 本 章 中 ,为 了 说 明 提 出 方 
法 的 先进 性 、 可 用 性 和 准确 性 ,联合 多 步 向 前 健康 状态 识别 算法 与 一 般 的 多 步 向 前 
健康 状态 识别 算法 和 一 步 向 前 健康 状态 识别 算法 进行 比较 ,并 在 案例 中 进行 详细 
的 分 析 。 
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给 定 设备 从 初始 时 间 到 时 间 nn 一 1 的 全 部 可 用 状态 监测 信息 ,通过 联合 
HSMM 和 SMC 方法 ,提出 了 一 种 新 颖 的 联合 多 步 向 前 健康 状态 识别 算法 。 并 且 ， 
将 提出 的 算法 应 用 到 在 线 设备 隐藏 故障 识别 中 ,因为 在 该 算法 中 ,对 于 设备 的 健康 
状态 识别 ,HSMM 具有 丰富 的 数据 结构 。 联 合 多 步 向 前 健康 状态 识别 算法 可 以 准 
确 地 描述 设备 隐藏 状态 和 监测 信息 之 间 的 关系 。 

健康 状态 识别 算法 与 一 步 向 前 健康 状态 识别 是 相互 关联 的 。 基 于 提出 的 算法 
@ ,一 步 向 前 健康 状态 识别 的 状态 概率 密度 函数 可 以 通过 一 种 递归 的 方式 来 获得 。 
假设 状态 概率 密度 函数 pea | naa. 可 以 用 (xia sena Yos 来 近似 表示 ,因此 ， 
状态 概率 密度 函数 可 表达 为 

PG | Hy) = DONA — zia) 

状态 概率 密度 函数 p(x | ws) 可 以 用 来 自 (nhu ha yos 的 新 的 观测 样 
本 来 表示 (符号 -代表 预测 值 ) 。 因 此 ,一 步 向 前 健康 状态 识别 算法 的 流程 可 以 被 描 
X. 

算法 四. 在 线 一 步 向 前 健康 状态 识别 算法 

步骤 1. 对 于 预测 值 x ~ plz | ana? ,预测 的 一 步 向 前 概率 密度 函数 可 以 表 


示 为 
N, 


D(x, | yis S Sal eG, — di) 
步骤 2. 更 新 权重 w, = ply, | Tiwha ,可 以 获得 
N, 
wi = wi/ Dw 
步骤 3. 根据 下 列 方程 计算 状态 概率 密度 


N, 


bG, | xis ~ Muti, — ai) 

为 了 有 效 地 预测 设备 健康 状态 ,在 算法 Q@ 的 基础 上 ,提出 了 联合 多 步 向 前 健康 状 
态 识 别 算法 。 并 且 , 基 于 当前 的 健康 状态 识别 算法 @ ,可 以 获得 prid yai s TR 
据 条 件 概率 和 概率 的 链条 规则 ,可 以 获得 联合 多 步 向 前 概率 函数 表达 式 : 

PG. | yu = Toca, | yu Baga) 


在 上 面 的 联合 概率 方程 中 , pany | Yii Lanta) S01. h—1 仅仅 是 多 步 
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向 前 健康 状态 识别 概率 ,并 且 可 以 用 (Erto Wha he 来 近似 表达 ,因此 


Dle | Yin) = f- [TE oc; | zjDpG, ios [Es 


joan 


总 Sls I oos | zb Gra | aD dass 
i=l j=nt2 


N, 
A S alb ads — axi) 
i=l 
其 中 ,6(. JEA HL sc eg C9 。 
基于 上 述 内 容 ,设备 联合 h 步 向 前 健康 状态 识别 概率 可 以 用 一 些 粒子 来 近似 
表达 ,为 了 更 准确 地 表示 联合 h 步 向 前 健康 状态 识别 概率 ,这 些 粒 子 都 具有 相应 的 
权重 ,这 些 权重 可 以 表示 为 
(Gh sx. Gps sto} i 


因此 ,联合 六 步 向 前 健康 状态 识别 概率 可 以 表示 为 


PG | 3i = à > (wi, vt wh) 


is (3-1) 
May — 22 rua — Tike) 

通过 下 述 的 算法 @ 来 描述 在 线 联 合 多 步 向 前 健康 状态 识别 算法 。 

算法 @ ”在 线 联 合 多 步 向 前 (4 步 ) 健 康 状态 识别 算法 


步骤 1 基于 算法 中 的 步骤 1, 一 步 向 前 状态 概率 密度 函数 可 以 表示 为 


N, 
BG. | yu © Dy wid, — zi) 
步骤 2 WMR /一 1, 算 法 流程 直接 跳 转 到 步骤 3 ,否则 ,设置 人 一 1。 
步骤 2.1 在 这 一 步 中 ,预测 值 Coa } 来 更 新 权重 (ula ji ,基于 方程 
Wai 一 baa | Xia uia: ,预测 的 多 步 向 前 条 件 概率 密度 函数 可 以 表示 为 


N, 


p Goo | Yiri tTn) 7v Swit lEnm 一 ai 
i=1 


步骤 2. 2 对 于 预测 值 rss ~ pCrua | esa) ,预测 的 多 步 向 前 概率 密度 函数 
可 以 表示 为 


N, 
s 


DG | yu S Pula OTe — ia) 
i=1 
步骤 2.3 更 新 & 一 A 十 1。 如 果 k=h, EFR G-1) ,可 以 获得 联合 h 步 向 前 健 
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康 状态 识别 概率 密度 函数 ,因此 跳 转 到 步骤 3, 否 则 ,返回 步骤 2. 1。 

步骤 3 当 在 线 观 测 值 y, 可 用 的 时 候 , 需 要 进行 权重 更 新 工作 ,更 新 表达 式 为 
Wh = pO | Tiwa ,更 新 当前 概率 密度 函数 可 以 表示 为 

3j | ae is = 20 

基于 算法 @ ,对 于 一 个 给 定 的 新 的 连续 观测 数据 序列 ,可 以 获得 当前 时 刻 的 状 
态 识别 概率 。 基 于 获得 的 状态 识别 概率 ,可 以 有 效 地 预测 处 于 当前 时 刻 的 设备 剩 
余 寿命 值 。 

显然 ,联合 多 步 向 前 健康 状态 识别 算法 和 多 步 向 前 健康 状态 识别 算法 之 间 的 
关系 可 以 被 描述 为 

Pm | yia?) 一 Me Dua | Yn 


在 上 述 的 方程 中 ,多 步 向 前 概率 密度 函数 p(x | o 是 联合 多 步 向 前 概 
率 密度 函数 pressus | you 的 边缘 分 布 。 如 果 在 设备 健康 预测 中 ,对 于 预测 的 
精度 要 求 不 是 很 高 ,那么 在 这 种 情况 下 ,多 步 向 前 健康 状态 识别 算法 完全 可 以 满足 
使 用 要 求 。 如 果 对 于 健康 预测 精度 要 求 比较 高 , 则 多 步 向 前 健康 状态 识别 算法 不 
能 满足 使 用 要 求 ,那么 在 这 种 情况 下 ,联合 多 步 向 前 健康 状态 识别 算法 被 应 用 到 设 
备 健 康 预 测 中 。 联 合 多 步 向 前 健康 状态 识别 算法 在 实时 的 健康 预测 中 具有 比 多 步 
向 前 健康 状态 识别 算法 更 高 的 预测 精度 。 因 为 ,在 整个 预测 过 程 中 ,联合 多 步 向 前 
健康 状态 识别 算法 始终 保持 HSMM 的 马尔 可 夫 连 续 性 。 

在 获得 设备 的 状态 识别 概率 以 后 ,我 们 还 需要 确定 设备 的 健康 状态 转折 点 ， 
设备 健康 状态 转折 点 是 指 设备 从 健康 状态 xz, 转 移 到 健康 状态 mm+i 的 时 刻 点 。 在 
设备 健康 预测 的 过 程 中 ,通过 观察 设备 的 健康 状态 转折 点 ,从 设备 当前 状态 到 健 
康 状态 转折 点 的 时 间 可 以 被 评估 。 在 设备 健康 预测 模型 中 ,设备 的 健康 状态 转 
折 点 对 应 从 健康 状态 xz, 转移 到 健康 状态 zi+1 的 时 刻 。 对 于 如 何 确定 设备 的 健康 
状态 转移 点 ,可 以 通过 下 列 方式 来 进行 识别 : 当 获 得 新 的 监测 信息 时 ,应 用 联合 
多 步 向 前 在 线 健康 状态 转移 算法 进行 状态 在 线 识别 ,进行 在 线 健康 预测 ,如 果 概 
率 密度 函数 p(Si 王 ziti1y1.1-1) 的 值 在 时 刻 1 前 一 直 是 增加 的 ,并 且 , 在 时 刻 7， 
PCS arts | yin AR FEAL US AL 就 是 设备 健康 预测 过 程 中 的 状态 转折 点 。 

假设 设备 存在 两 个 健康 状态 , 则 对 于 实时 观测 向 量 wy …xyzr' 设 备 的 识别 状 
态 序 列 情况 如 图 3-2 所 示 。 从 图 3-2 中 可 以 看 到 ,每 一 个 健康 状态 的 序列 都 存在 设 
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备 的 健康 状态 转折 点 。 并 且 ,基于 算法 @, 可 以 获得 设备 停留 在 当前 状态 的 概率 ， 
在 此 基础 上 ,可 以 对 设备 的 剩余 有 效 寿 命 进 行 预 测 。 





图 3-2 设备 健康 状态 识别 序列 (含有 两 个 健康 状态 ) 
3.2.3 ”剩余 有 效 寿命 预测 方法 


设备 的 健康 状态 有 效 预测 的 目的 就 是 预测 设备 的 故障 状态 的 发 展 趋势 ,进而 
获得 设备 的 剩余 有 效 寿命 。 假 设 设备 在 进入 其 故障 状态 F(s,) 前 ,设备 将 经 历 几 个 
中 间 状 态 , 可 以 用 s(i 二 1,2,…,n 一 1) 来 表示 。 在 健康 状态 s ,设备 的 期 望 驻 留 时 
HH D(s;) 来 表示 ,这 就 说 明了 当 设 备 转移 到 健康 状态 s; 时 ,停留 在 健康 状态 ;; 的 
设备 剩余 驻 留 时 间 和 设备 停留 在 未 来 故障 状态 前 的 所 有 中 间 健 康 状 态 的 有 效 剩 余 
驻 留 时 间 的 总 和 构成 了 设备 总 的 剩余 有 效 寿命 。 计 算 框架 如 图 3-3 所 示 。 


a 
n a, 43 E 








设备 寿命 =D(s,)+D(s,)+D(s,)+…+D(s,) 
D(s,): 设 备 停留 在 健康 状态 ,的 驻 留 
5 健康 状态 1 (Baseline);s,: 健 康 状态 2 (Degradation1)， …35,: 健 康 状态 N(Failure) ;a :转移 概率 


图 3-3 ”设备 剩余 寿命 计算 框架 
在 第 /个 样本 观测 时 刻 点 ,用 DGP) 来 表示 设备 在 健康 状态 ;; 的 有 效 驻 留 时 
间 , 则 ,对 于 该 驻 留 时 间 的 计算 见 下 列 方程 : 
D(s;) = ylsi) + po? (si) 
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p = [lifetime — 2/4G)1/ XP si) 
DG?) = pS, = s; | y1u) DG) (3-2) 
在 上 述 方程 中 , jy(s;) 表示 健康 状态 ;; 的 驻 留 概率 函数 p GOD JOE HE s o^ GS K 
示 健 康 状态 # 的 驻 留 概率 函数 户 (d) 的 方差 。D(s ) 是 健康 状态 5, AY SE FA TTA, pS, = 
sy 表示 在 第 /个 样本 观测 时 刻 点 ,基于 观察 向 量 mw, 的 健康 状态 的 状态 概率 。 
当 设备 进入 健康 状态 ;; 后 的 第 1 个 样本 观测 时 刻 点 时 ,基于 式 (3-2) ,设备 剩余 
有 效 寿命 的 模型 可 以 表示 为 
nl 
RUL® = DG?) + >) DG;) (3-3) 


联合 式 (3-2) 和 式 (3-3) , 当 设 备 进 入 状态 5 后 的 第 7 个 样本 观测 时 刻 点 时 ,可 
以 计算 求 出 相应 的 设备 有 效 剩 余 寿命 预测 值 。 

本 节 提 出 的 方法 ,将 用 于 在 线 识别 设备 的 健康 状态 ,并 且 计 算 相应 的 设备 剩余 
有 效 寿 命 。 因 此 ,在 线 健康 预测 方法 的 基本 步骤 如 下 。 

第 一 步 ,根据 以 前 的 设备 历史 监测 数据 ,对 HSMM 模型 进行 训练 ,获得 最 侍 
的 适应 于 单 监测 信息 在 线 健康 预测 的 HSMM 参数 ,包括 HSMM 的 初始 转移 概 
率 .设备 健康 状态 驻 留 时 间 等 。 

第 二 步 ,这 一 步 是 与 当前 健康 状态 的 识别 有 关 , 基 于 算法 加 ,在 设备 进入 健康 
状态 5 后 的 第 /个 样本 观测 时 刻 点 , 随 着 在 线 监测 数据 的 获得 ,用 联合 多 步 向 前 健 
康 状态 识别 算法 计算 健康 状态 ,的 概率 密度 函数 值 。 同 时 ,计算 获得 设备 的 健康 
状态 转折 点 。 

第 三 步 ,在 第 二 步 的 基础 上 ,在 设备 进入 健康 状态 “后 的 第 ! 个 样本 观测 时 刻 
点 ,按照 方程 式 (3-2) ,计算 设备 在 健康 状态 ;的 剩余 有 效 驻 留 时 间 。 

第 四 步 ,在 设备 进入 健康 状态 后 的 第 7 个 样本 观测 时 刻 点 ,按照 方程 式 
(3-3) ,计算 设备 的 剩余 有 效 寿 命 。 


3.3 算 例 分 析 


本 章 内 容 的 实验 测试 ,是 在 美国 某 个 实验 室 所 做 的 关于 液压 泵 (设备 ) 的 长 期 
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疲劳 磨损 的 测试 ,在 实验 中 ,使 用 了 3 台 液 压 泵 (分 别 为 A,B 和 C) ,在 实验 过 程 中 ， 
为 了 促使 液压 泵 进行 磨损 ,在 液压 泵 中 添加 了 油 有 泥 沙 ,在 这 种 情况 下 ,对 于 流量 
降低 到 不 同 程度 的 目的 ,也 可 以 达到 。 针 对 液压 泵 的 实验 分 析 , 在 实验 中 的 泥 沙 污 
染 可 以 划分 为 四 个 级 别 :级 别 1( 正 常 状 态 )、 级 别 2( 在 油箱 中 放 入 Smg,20-mm Yé 
ib) .级 别 3( 在 油箱 中 放 入 10mg,20-mm) 级 别 4( 在 油箱 中 放 入 15mg,20-mm)。 在 
该 磨损 测试 的 实验 过 程 中 ,对 于 泵 的 健康 级 别 , 它 的 流量 损耗 级 别 是 直接 对 应 于 它 
的 泥 沙 污染 级 别 的 , 且 流量 损耗 级 别 是 与 泥 沙 的 污染 级 别 正 相 关 的 。 并 且 , 在 液压 
泵 的 实验 中 ,流量 是 与 液压 泵 的 健康 等 级 状态 直接 对 应 的 ,用 来 衡量 液压 泵 的 健康 
等 级 状态 。 所 以 ,在 实验 中 ,液压 泵 的 健康 等 级 状态 被 液压 泵 流量 的 泥 沙 污染 级 别 
所 定义 。 

在 实验 室 的 实验 过 程 中 ,将 液压 泵 加 速 计 安 装 在 与 液压 泵 旋转 轴 平 行 的 位 置 ， 
该 加 速 计 用 来 进行 收集 在 线 的 振动 信号 。 图 3-4 显示 了 实验 的 组 织 结构 。 

在 实验 分 析 测 试 过 程 中 ,采用 Back Hoe Loader; 74cm? /rev 的 变量 液压 泵 。 
在 液压 泵 的 监测 与 搜集 数据 的 过 程 中 ,对 于 搜集 数据 数量 ,采样 频率 是 60kHz; 对 
于 来 自 加 速 计 的 振动 信号 ,使 用 反 锯 齿 滤 波 器 进行 处 理 ; 对 于 数据 的 特征 值 的 提 
取 ,使 用 小 波 包 中 的 Daubechies wavelet 10( 五 层 小 波 分 解 层 数 ) ,从 而 可 以 对 检测 
到 的 数据 信号 中 的 故障 信息 进行 有 效 提取 5 ;对 于 来 自 数据 小 波 包 分 析 操 作 中 的 
小 波 系数 ,用 于 HMM 方法 和 HSMM 方法 的 输入 值 。 在 实验 测试 中 ,最 先 做 的 工 
作 是 应 用 HSMM 对 液压 泵 的 健康 状态 进行 分 类 ,为 了 说 明 HSMM 在 设备 健康 预 
测 方面 的 性 能 ,对 HSMM 和 HMM 就 分 类 性 能 方面 进行 了 比较 分 析 。 


试验 台 数据 收集 装置 数据 处 理 装置 


* à 
dost Dd I 


泵 加 速度 器 数据 收集 信号 处 理 
流量 排放 箱 Ea 特征 提取 


故障 识别 











3-4 实验 设置 流程 
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3.3.1 基于 HSMM 的 健康 诊断 


在 实验 过 程 中 ,我 们 首先 用 HSMM 对 液压 泵 的 健康 进行 诊断 ,为 了 说 明 
HSMM 的 健康 诊断 性 能 优 于 HMM 的 健康 诊断 性 能 ,对 HSMM 和 HMM 进行 了 
比较 分 析 , 表 3-1 描述 了 在 每 个 健康 状态 下 ,关于 HSMM 和 HMM 进行 训练 与 测 
试 的 数据 标准 。 

表 3-1 HSMM 和 HMM 训练 的 数据 数量 (液压 泵 ) 














健康 状态 1 健康 状态 2 健康 状态 3 健康 状态 4 
(Baseline) (Degradation 1) (Degradation 2) (Failure) 
训练 测试 训练 测试 训练 测试 训练 测试 
RA 12 2 8 1 11 2 8 2 
FB 8 2 8 2 10 2 8 2 
KC 8 1 8 2 8 2 9 2 


























表 3-2, He 3-3 和 表 3-4 分 别 表 示 HSMM 与 HMM 对 三 个 液压 泵 的 诊断 结果 。 
表 3-2 SR A B HSMM 和 HMM 测试 结果 (x 表示 分 类 错误 ) 









































最 大 似 Baseline Baseline | Degradation 1 | Degradation 2| Degradation 2| Failure Failure 
然 值 测试 1 测试 2 测试 1 测试 1 测试 2 测试 1 测试 2 
HMMs | 一 135. 997 4| 一 105. 592 9 = — = = = 
HMMpi; = = —16. 237 5 — m — — 
HMMp; = = = x x — = 
HMMr = —177. 537 6 x 
HSMMs —0.278 7 15.405 3 = = = — = 
HSMMpi = = 21.9241 — m — = 
HSMMp2 —1 = —611. 734 1| —25. 705 7 8. 879 5|—215. 111 9|—204. 399 9 
HSMMr — — x 一 716. 202 1| —327. 967 1 16. 351 7 2. 786 7 











液压 泵 的 健康 状态 识别 情况 如 下 : 

对 液压 泵 A, 基 于 HMM 的 分 类 率 为 4/7= 二 57%。 基 于 HSMM 的 分 类 率 为 
7/7=100%, 

对 液压 泵 B, 基 于 HMM fi 438 528 6/8— 7594, SEF HSMM 的 分 类 率 为 
7/8=87.5%. 

对 液压 泵 C, 基 于 HMM 的 分 类 率 为 7/7= 二 100%。 基 于 HSMM 的 分 类 率 为 
7/7=100%. 
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上 述 实验 结果 表明 ,对 于 设备 的 健康 状态 分 类 ,与 HMM 相 比 较 ,HSMM 具有 
更 高 的 和 更 精确 的 设备 健康 状态 识别 率 ,就 设备 总 的 故障 诊断 方面 来 说 , HSMM 
具有 96% 的 识别 率 。 在 实验 中 ,对 于 某 个 液压 泵 的 健康 诊断 来 说 ,与 当前 HMM 
的 诊断 模型 相 比 ,HSMM 的 正确 识别 率 可 以 增加 25. 3%。 并 且 , 根 据 实验 的 计算 
过 程 , 对 于 模型 的 计算 时 间 的 长 度 , HMM 和 HSMM 基本 上 是 相同 的 。 所 以 ,在 
实际 的 应 用 中 ,涉及 具有 大 量 数据 集 的 时 候 , 对 HMM 来 说 ,HSMM 具有 更 高 的 识 
别 效率 。 


3.3.2 数据 准备 与 处 理 


原始 监测 数据 的 分 析 , 主要 包括 均 方 根 (RMS) 和 峰 度 (Kurtosis) 两 个 方面 。 
对 设备 的 状态 监测 和 运转 阶段 描述 来 说 ,RMS 是 一 个 基本 的 特征 。 峰 度 主要 描 
述 了 每 一 监测 时 刻 点 监测 数据 的 频谱 的 趋势 。 一 个 高 峭 描 绘 了 一 个 具有 较 长 尾 
部 的 频谱 ,而 低 峰 度 描绘 了 一 个 具有 较 短 尾部 的 频谱 和 一 个 集中 走向 均值 的 频 
谱 分 布 。 可 以 看 出 的 是 ,在 数据 监测 过 程 中 ,RMS 和 峰 度 的 特征 显示 了 一 个 稳 
定 的 运转 阶段 。 图 3-5 表示 了 监测 数据 的 RMS 和 峰 度 趋势 。 从 图 2-7 中 可 以 看 
出 , 随 着 设备 健康 状态 的 不 断 演 化 和 观测 时 刻 点 的 增多 ,出 现 了 一 些 具 有 强烈 变 
化 的 时 刻 点 。 例 如 ,第 13 个 样本 观测 时 刻 点 ,第 23 个 样本 观测 时 刻 点 ,第 36 个 
样本 观测 时 刻 点 ,分 别 出 现 了 强烈 的 转折 点 ,也 就 是 上 面 所 说 的 设备 健康 状态 转 

基于 上 述 对 监测 数据 的 RMS 和 Kurtosis 分 析 , 由 于 原始 监测 数据 数量 巨 
大 ,对 于 原始 监测 数据 ,在 此 用 少数 几 个 时 刻 点 的 监测 数据 来 描述 试验 振动 信号 
的 分 类 信息 。 对 应 一 些 特殊 监测 时 刻 点 ,图 3-6 显示 了 几 个 原始 监测 数据 的 时 
域 频谱 。 图 3-6(a) 描 述 了 第 12 个 监测 时 刻 点 的 信号 频谱 ,在 此 时 刻 点 ,RMS= 
1. 474, Kurtosis—0. 506 75, 并 且 液 压 泵 处 于 健康 状态 1(Baseline)。 图 3-6(b) 描 
XR f 5 13 个 监测 时 刻 点 的 信号 频谱 ,在 此 时 刻 点 ,RMS=1.236 7, Kurtosis — 
0. 721 27, 并 且 液 压 泵 从 第 13 个 观测 时 刻 点 开始 处 于 健康 状态 2 C Degradation 
1)。 图 3-6(d) 描 述 了 第 23 个 监测 时 刻 点 的 信号 频谱 ,在 此 时 刻 点 , RMS— 
2. 044 2, Kurtosis— 6. 180 3, 并 且 液 压 泵 从 第 23 个 观测 时 刻 点 开始 处 于 健康 状 
态 3(Degradation 2) 。 图 3-6(f) 描 述 了 第 37 个 监测 时 刻 点 的 信号 频谱 ,在 此 时 刻 
Hi. RMS=2. 038 2, Kurtosis— 6. 291 7, 并 且 液 压 泵 从 第 37 个 观测 时 刻 点 开始 
处 于 健康 状态 4(Failure) 。 
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1 5 9 B 10 A 25 29 33 3 4 45 
监测 时 刻 点 
(a) 原始 监测 数据 的 RMS 变 化 趋势 











1 5 9 13. 107 21 25 29 ^33 3 04 — 45 
监测 时 刻 点 
(b) 原始 监测 数据 的 Kurtosis 变 化 趋势 
图 3-5 原始 监测 数据 的 RMS 和 Kurtosis 
液压 泵 的 状态 监测 主要 是 用 于 预测 它 的 健康 状况 。 为 了 得 到 一 个 可 靠 的 健康 
预测 ,需要 被 监测 的 特征 应 该 对 振动 趋势 非常 敏感 。 我 们 用 小 波 变换 去 除 原始 信 
号 的 噪声 ,并 且 做 特征 提取 。 不 同 于 具有 一 个 确定 的 基本 函数 的 傅立叶 变换 ,小 波 
变换 具有 强大 的 结构 和 巨大 的 灵活 性 :是 一 个 时 间 和 频 域 的 局 域 变换 。 并 且 , 它 能 
有 效 地 从 信号 中 提取 信息 ,用 伸缩 和 平移 等 运算 功能 对 信号 逐步 进行 多 尺度 细 化 ， 
目的 就 是 达到 高 频 处 时 间 细 分 ,低频 处 频率 细 分 ,使 小 波 变换 能 自动 适应 时 频 信号 
分 析 的 要 求 , 因 而 它 是 时 频 分 析 和 处 理 非 平稳 信号 的 一 种 很 好 的 工具 。 对 于 液压 
泵 的 健康 预测 ,不 止 一 个 泵 的 特征 被 需要 ,因而 基于 全 部 监测 信号 ,可 以 用 小 波 振 
幅 模式 演示 对 于 健康 预测 如 何 处 理 液压 泵 的 特征 。 
在 对 监测 信号 进行 特征 提取 后 ,可 以 获得 模型 的 观测 值 ,并 且 , 这 些 观测 值 作 
为 模型 的 输入 来 进行 设备 的 健康 状态 预测 。 对 应 于 图 3-6 的 一 些 特殊 的 观测 时 刻 
点 ; 表 3-5 展示 了 部 分 小 波 变换 后 的 数据 ,小 波 变换 后 的 数据 输入 在 线 健 康 预 测 的 
模型 进行 健康 状态 预测 。 表 3-5 分 别 是 第 12 个 样本 观测 时 刻 点 、 第 13 个 样本 观 
测 时 刻 点 .第 22 个 样本 观测 时 刻 点 .第 23 个 样本 观测 时 刻 点 、 第 36 个 样本 观测 时 
刻 点 、 第 37 个 样本 观测 时 刻 点 的 数据 。 
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RMS-1.147 Kurtosis-0.50675 RMS- 1.2367 Kurtosis=0.72127 
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(b) 第 13 个 观测 时 刻 点 的 谱 分 析 
RMS-2.0442 Kurtosis=6.1803 
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(a) 第 12 个 观测 时 刻 点 的 谱 分 析 
RMS=1.1034 Kurtosis-0.42287 
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(c) 第 22 个 观测 时 刻 点 的 谱 分 析 


RMS=1.227 Kurtosis=0.69406 
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(d) 第 23 个 观测 时 刻 点 的 谱 分 析 


RMS=2.0382 Kurtosis=6.2917 
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(e) 第 36 个 观测 时 刻 点 的 谱 分 析 


“0 200 400 600 800 1000120014001600 
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(f£) 第 37 个 观测 时 刻 点 的 谱 分 析 


3-6 ”原始 监测 数据 的 时 域 谱 
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表 3-5 部 分 小 波 变化 数据 





































































































监测 时 刻 点 (健康 状态 ) 
12(s1) 13(s2) 22(s2) 23(s3) 36) 3764) 
2.2510 2.4116 2.438 6 39. 024 3 2.6210 44.122 4 
5. 860 4 5. 682 8 5. 386 5 3. 743 9 3.819 9 5. 838 0 
10. 639 9 5. 882 8 6.480 9 11.227 0 10. 441 5 9,511 1 
9. 384 4 6.122 6 6. 832 3 6. 805 5 6. 265 7 7.384 1 
7.9015 7.902 0 7. 822 3 9.544 8 7.896 6 9.115 1 
6.438 7 9.133 9 8.279 4 14. 368 5 13. 286 7 15. 277 7 
18. 533 0 5.373 4 6. 240 2 10. 305 3 8. 243 5 7.9120 
11.855 5 7.609 4 7.224 7 10.044 0 10.095 1 9.354 7 
2.349 0 3.129 4 3.038 7 4. 264 6 3.799 2 5.1613 
2.7154 3.437 7 3.034 4 4.257 3 3.874 4 5.247 2 
3.5530 4.366 8 4.363 9 6.169 8 5.044 3 6.010 2 
3. 307 7 4.038 4 3.772 6 5. 334 9 4.337 4 5.118 5 
7.876 1 9.1150 8.8220 8. 723 0 7.539 5 8. 469 8 
5. 607 2 10.655 5 10.3814 12.195 6 10.100 6 10.229 7 
4.510 9 6.842 3 7.709 0 9.057 7 6.707 0 6.902 4 
6.938 6 15. 307 9 16.965 3 25.246 6 17.359 3 17.156 6 
0.038 5 0.039 8 0.047 0 0.053 6 0.041 7 0.053 8 
0.057 0 0.063 5 0.078 7 0. 060 0 0.055 0 0.056 1 
0.049 4 0.077 4 0. 086 7 0. 086 1 0.069 9 0.1218 
0.052 4 0.076 9 0.072 8 0.062 6 0.053 6 0.0734 
0. 180 6 0. 203 4 0. 203 9 0. 239 2 0. 188 3 0. 330 7 
0.192 4 0. 231 7 0. 244 7 0.312 6 0. 264 0 0.370 8 
0.062 2 0.084 3 0.096 3 0.116 4 0.093 2 0.150 6 
0.127 4 0.214 3 0.222 5 0. 307 6 0. 2417 0. 283 2 
2.1849 2.998 7 2.8211 4.081 7 3.6413 5.109 2 
1.8818 2.5914 2.202 5 3.002 1 2.805 4 3.818 7 
1. 080 6 1.562 8 1.582 5 1.786 5 1.547 0 1.913 8 
1.485 5 1.758 5 1.570 7 2.295 4 1.978 4 2.545 8 
0. 234 3 0.288 6 0.305 1 0.303 1 0. 242 2 0.394 1 
0.522 6 0.734 8 0.735 6 1.057 3 0.884 8 1.046 0 
0.925 0 1.466 6 1.612 6 1.716 9 1. 400 8 1. 707 0 
0. 813 9 1.664 3 1. 837 8 2.417 2 1.698 5 1. 808 6 
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3. 3.3 模型 参数 估计 


设备 的 健康 改变 机 制 , 通 常 涉及 几 个 设备 的 衰退 健康 状态 。 从 设备 的 正常 运 
行 到 设备 发 生 故 障 , 设 备 一 般 要 经 历 几 个 衰退 状态 ,并 且 , 状 态 之 间 是 相互 联系 的 ， 
且 可 以 通过 状态 转移 概率 来 决定 状态 之 间 的 相互 转移 。 

在 案例 分 析 中 ,液压 泵 有 4 个 隐藏 的 健康 状态 ,分 别 被 定义 为 :好 (Baseline)、 
(Degradation 1), # (Degradation 2)、 坏 (Failure)。 对 于 状态 间 的 转移 关系 如 
图 3-7 所 示 。 











时 间 进 程 


图 3-7 设备 健康 状态 演化 机 制 结构 

设备 在 整个 健康 状态 转换 过 程 中 ,存在 三 个 概率 分 布 函数 ,分 别 是 状态 转移 概 
率 、 状 态 驻 留 概 率 分 布 和 观察 值 概率 分 布 。 

对 于 健康 状态 转移 概率 ,假设 Ay 表示 状态 转移 概率 矩阵 第 ; 行 的 第 j 个 元 素 ， 
则 健康 状态 转移 概率 可 以 用 下 列 方程 来 表示 : 

Ay = (aon, ea8)/ 3 (a-9» TAA.) i,j = 1,2,3,4 
在 方程 中 , A; 的 值 来 自 维护 专家 的 经 验 知识 , m 表示 设备 从 健康 状态 x; 到 健康 
状态 zj 的 转移 次 数 ( mi 表示 状态 x; 出 现 的 计数 统计 ) A 被 用 来 控制 专家 知识 和 实 
际 观察 之 间 的 权重 。 

对 于 设备 的 健康 状态 驻 留 概率 分 布 ,可 以 用 下 列 方程 来 表示 : 


1 2 lí(d-—gG2 . 
piGD a(s;) Zo H a(s;) ) pedes 
在 方程 中 , o^ GO 是 第 i 个 健康 状态 的 方差 , n GO. 表示 第 i 个 健康 状态 的 均值 。 


对 于 设备 的 观察 值 序列 ,对 于 每 一 个 健康 状态 ,两 个 高 斯 混合 方程 被 用 来 表示 
观察 值 序列 的 概率 分 布 ,详细 方程 表示 形式 如 下 : 











2 
bo) = XJ oN opta Ua) i= 1,2,9.4:k = 1,2 


k=1 


cg. 
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在 方程 中 , N(o, ,ua Un) 表示 健康 状态 s; 的 第 k 个 混合 高 斯 分 布 。ua UE Mwa 
分 别 表示 健康 状态 *; 的 第 & 个 混合 高 斯 分 布 的 均值 方差 和 混合 权重 。 并且， 


2 
Swe =1 wa >0,i=1l,2,3,4;k = 1,2 
k=1 


因此 ,在 线 设备 健康 预测 模型 可 以 被 描述 为 
{A,B,D,x}= (ag ua Uh wa spi oim 51 i,j 4lxkx2) 


3.3.4 在 线 健康 预测 分 析 


对 于 案例 中 液压 泵 的 健康 预测 分 析 , 所 有 的 寿命 训练 数据 都 是 来 自 案例 中 的 
液压 泵 。 一 个 具有 四 个 健康 状态 好 (Baseline) .中 (Degradation 1) 、 差 (Degradation 
2) (Failure) ff HSMM 被 训练 。 其 中 ,对 于 4 个 健康 状态 之 间 的 状态 转移 概率 ， 
则 是 液压 泵 初始 运转 过 程 中 的 转移 概率 ,对 于 每 个 健康 状态 的 驻 留 时 间 的 期 望 值 ， 
也 可 以 经 过 HSMM 的 训练 得 到 。 对 于 健康 状态 转移 概率 和 健康 状态 的 驻 留 时 间 
期 望 值 分 别 如 表 3-6 和 表 3-7 所 示 。 

表 3-6 ”健康 状态 间 的 原始 转移 概率 














健康 状态 好 中 差 坏 
好 0.905 6 0.087 9 0. 006 3 0. 000 2 
中 0 0. 849 1 0. 150 6 0.000 3 
2 0 0 0.912 9 0.087 1 
坏 0 0 0 1 














R37 ”健康 状态 期 望 驻 留 时 间 











健康 状态 好 中 差 坏 
驻 留 均值 10.454 9 9. 792 3 11.337 5 — 
驻 留 方 差 1.938 8 0.979 2 1.2415 — 

DG; 10.648 5 9. 890 0 11.4615 — 














在 案例 中 ,我 们 用 s; 表示 健康 状态 Baseline 462 ,用 表示 健康 状态 Degradation 
1( 中 ) ,用 :表示 健康 状态 Degradation 2( 差 ) ,用 :表示 健康 状态 Failure( 坏 ) ,用 S 
表示 健康 状态 的 集合 (yw eS ,其 中 ,表示 在 第 ! 个 健康 观测 时 刻 点 的 健康 状态 ) 。 
在 每 一 健康 状态 观测 时 刻 点 ,液压 泵 的 历史 健康 状态 趋势 如 图 3-8 所 示 , 其 中 ,对 
于 坐标 轴 y,1 表示 51 ,2 表示 52 ,3 表示 s3,4 表示 sao MBI 3-8 中 可 以 看 出 ,液压 泵 
的 健康 状态 随 着 时 间 的 变化 ,呈现 一 个 衰退 的 趋势 。 
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健康 状态 
二 








和 


12345 678910112 I3 14 I5 16 17 18 19 2021 22 23 24 25 26 27 28 29 30 31 32 
观测 时 刻 点 


图 3-8 原始 健康 数据 的 状态 演化 
为 验证 本 章 提出 的 在 线 健 康 预测 模型 ,在 液压 泵 进入 Baseline 状态 后 ,首先 ， 
我 们 通过 5 个 观测 时 刻 点 的 数据 来 计算 液压 泵 的 剩余 寿命 有 效 值 ,借以 检验 所 提 
出 模型 的 有 效 性 。 当 液压 泵 停留 在 健康 状态 Baseline 时 , 则 可 以 计算 液压 泵 的 状 
BRIERS, =s | yiii ,一 1,…,5) ,计算 结果 如 表 3-8 所 示 。 
表 3-8 状态 识别 概率 (5 个 观测 时 刻 点 ) 





o 

















观察 时 刻 点 (2) 状态 概率 健康 状态 
1 0. 882 1 
2 0. 855 6 
3 0. 790 8 5 
4 0. 774 4 
5 0. 637 9 








然后 ,基于 式 (3-2) 和 式 (3-3) ,计算 这 5 个 观测 时 刻 点 的 液压 泵 的 剩余 寿命 有 
效 值 。 并 且 ,根据 液压 泵 的 实际 剩余 寿命 有 效 值 , 对 预测 值 进行 有 效 验 证 。 液 压 泵 
的 实际 剩余 寿命 值 和 预测 寿命 值 ,以 及 两 者 之 间 的 相对 误差 如 表 3-9 所 示 。 从 
BE 3-9 中 可 以 看 出 ,对 液压 泵 的 在 线 健康 预测 来 说 ,本 章 所 提出 的 方法 是 非常 有 效 
的 。 其 中 ,相对 误差 的 计算 公式 如 下 : 

相对 误差 二 100% X | 实际 剩余 寿命 值 一 预测 剩余 寿命 值 | /实际 剩余 寿命 值 


表 3-9 预测 剩余 寿命 值 和 实际 剩余 寿命 值 (5 个 观测 时 刻 点 ) 

















实际 RUL 计算 RUL 相对 误差 (%%) 
32.000 0 30. 352 1 5.149 8 
31.000 0 30.074 6 2.985 1 
30. 000 0 29.398 0 2.006 7 
29.000 0 29. 226 2 0.780 1 
28.000 0 27. 798 9 0.718 1 
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为 了 进一步 验证 本 章 所 提出 的 方法 对 于 液压 泵 的 单 监测 信息 在 线 健康 预测 是 
否 具有 更 优 的 有 效 性 ,样本 时 刻 点 从 5 个 观测 时 刻 点 扩大 到 29 个 观测 时 刻 点 。 

首先 ,基于 算法 @ ,观测 步 数 设置 为 4( 即 ==4,h 代表 观测 步 数 ) , 则 对 于 29 个 
观测 时 刻 点 ,液压 泵 的 健康 状态 变化 趋势 如 图 3-9 所 示 。 























1 3 5 7 9 11 1 3.5 7 9 11 13 15 17 19 21 
观测 时 刻 点 观测 时 刻 点 
(a) PSPS Yi) (b) p(Ssly,.) 














2 3 5 7 9 1113 15 17 19 21 23 252729 
观测 时 刻 点 
(c) p(Spsiy,.) 

图 3-9 健康 状态 概率 改变 趋势 
然后 ,在 获得 液压 泵 的 健康 趋势 以 后 ,计算 每 个 健康 状态 的 识别 概率 ,获得 液 
压 泵 的 健康 状态 转折 点 ( 见 图 3-9) 。 图 3-9(a) AI 3-9(b) 和 图 3-9(c) 分 别 代表 了 状 
态 si、ss 和 ss 的 概率 变化 趋势 。 对 于 液压 泵 的 健康 状态 ,假设 它们 都 是 从 健康 状态 
识别 概率 达到 最 大 值 的 观测 时 刻 点 开始 的 。 从 图 3-9(a) 中 可 以 看 出 ,从 第 6 个 观 
测 时 刻 点 到 第 12 个 观测 时 刻 点 ,液压 泵 的 健康 状态 停留 在 健康 状态 si; MAEI 3-9 
(b) 中 可 以 看 出 ,从 第 13 个 观测 时 刻 点 到 第 22 个 观测 时 刻 点 ,液压 泵 的 健康 状态 
停留 在 健康 状态 ss ;从 图 3-9(c) 中 可 以 看 出 ,从 第 23 个 观测 时 刻 点 到 第 29 个 观测 
时 刻 点 ,液压 泵 的 健康 状态 停留 在 健康 状态 ss 。 因 此 ,对 于 每 个 健康 状态 观测 时 刻 
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点 的 健康 状态 识别 概率 被 获得 ,如 表 3-10 所 示 。 
表 3-10 ”健康 状态 识别 概率 
观测 状态 健康 观测 状态 健康 观测 状态 健康 
时 刻 点 概率 状态 | 时 刻 点 概率 状态 | 时 刻 点 概率 状态 
6 0.518 6 13 0. 879 2 23 0.893 5 
7 0.390 7 m 0. 798 2 24 0. 863 2 
8 0. 341 3 15 0. 732 8 25 0.8014 
9 0.237 9 16 0. 630 7 26 0. 690 2 
10 0.302] | 17 0.591] - 27 0.618 7 
1 0.1327 | " 18 0.441]| ^" 28 0.5341 | ^" 
12 0.120 3 19 0. 338 4 29 0. 306 2 
20 0. 230 6 
21 0.186 4 
22 0.166 4 
最 后 ,基于 式 (3-2) ,计算 每 一 个 DGP) (4 代表 了 观测 时 刻 点 ,i 二 1,2,3), 获 


得 每 一 个 液压 泵 健康 状态 的 期 望 驻 留 时 间 值 。 根 据 式 (3-3) 和 DD(s?) 的 值 ,可 以 
获得 液压 泵 在 29 个 观测 时 刻 点 的 剩余 有 效 寿 命 值 , 表 3-11 显示 了 预测 的 剩余 寿 
命 有 效 值 和 液压 泵 的 实际 剩余 寿命 有 效 值 ,以 及 相对 误差 。 对 于 预测 值 和 实际 值 
之 间 的 比较 结果 如 图 3-10。 基 于 表 3-11 和 图 3-10 可 以 看 出 ,在 预测 的 剩余 寿命 有 
效 值 和 实际 剩余 寿命 有 效 值 之 间 的 相对 误差 很 小 。 因 此 ,根据 本 章 所 提出 的 在 线 
健康 预测 算法 ,可 以 很 好 地 获得 液压 泵 的 健康 状态 ,并 且 ,预测 的 健康 状态 可 以 与 
实际 的 液压 泵 的 健康 状态 相 匹 配 。 





一 :一 实际 RUL 





一 一 预测 RUL 

















3 5 7 9 m 13 15 17 19 21 23 25 27 29° 
观测 时 刻 点 
图 3-10 预测 RUL 与 实际 RUL 的 比较 (提出 的 在 线 健康 预测 方法 ) 
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表 3-11 预测 剩余 寿命 值 和 实际 剩余 寿命 值 (29 个 观测 时 刻 点 ) 

实际 RUL 预测 RUL 相对 误差 (€;) 实际 RUL 预测 RUL 相对 误差 (e) 
32.000 0 30. 352 1 5. 149 8 17. 000 0 17. 513 4 3.019 9 
31.000 0 30. 074 6 2.985 1 16. 000 0 17.174 3 7. 339. 3 
30. 000 0 29.398 0 2.006 7 15. 000 0 16.077 6 7.183 7 
29.000 0 29. 226 2 0. 780 1 14. 000 0 14.651 6 4.654 2 
28.000 0 27.798 9 0.718 1 13. 000 0 13.596 0 4. 584 4 
27.000 0 26.5515 1.6610 12.000 0 13.162 5 9.687 8 
26.000 0 25. 214 2 3.022 4 11. 000 0 12.966 7 17.879 0 
25.000 0 24. 698 2 1.207 1 10. 000 0 10. 130 1 1.300 6 
24.000 0 23.617 5 1.593 7 9.000 0 9. 786 6 8. 740 1 
23.000 0 23.316 5 1.376 2 8.000 0 9.085 8 13.572 0 
22.000 0 22.517 2 2.350 7 7.000 0 7.824 7 11.780 8 
21.000 0 22.387 3 6.606 2 6. 000 0 7.015 1 16.917 6 
20. 000 0 19. 946 9 0.265 5 5.000 0 6.055 8 21.116 6 
19.000 0 19.153 6 0. 808 4 4. 000 0 3.4710 13. 224 2 
18.000 0 18.513 0 2.849 9 











3.3.5 预测 性 能 评估 


通过 案例 分 析 ,我 们 可 以 看 出 ,本 章 所 提出 的 在 线 健 康 预测 算法 可 以 很 好 地 获 
得 设备 的 健康 状态 。 为 了 进一步 验证 提出 方法 的 有 效 性 ,我 们 将 分 析 HSMM, SE 
于 联合 多 步 算法 的 HSMM 方法 .基本 多 步 算法 的 HSMM、 基 于 一 步 算法 的 
HSMM 方法 在 设备 健康 预测 中 的 应 用 ,来 说 明 本 章 所 提出 的 联合 多 步 向 前 健康 预 
测算 法 的 优越 性 。 上 述 四 种 方法 的 预测 结果 如 表 3-12 所 示 。 并 且 ,该 四 种 方法 的 
预测 趋势 如 图 3-11 所 示 。 





表 3-12 ”四 种 方法 的 预测 结果 
































实际 RUL 基于 联合 多 步 基于 多 步 算法 的 | 基于 一 步 算 法 的 acii 
算法 的 HSMM HSMM HSMM 
30. 00 29. 398 29.398 0 29.398 0 30.255 8 
26. 00 25. 214 2 28. 585 4 27. 853 6 29. 964 3 
22. 00 22.517 2 26.0616 25. 329 7 29.795 4 
17. 00 17.513 4 15. 389 7 18. 327 4 19.498 1 
15. 00 16.077 6 13. 708 2 17.625 1 19. 208 1 
12. 00 13. 162 5 13. 489 2 15. 447 6 18. 866 6 
11. 00 12. 966 7 13.330 3 14. 309 6 10. 247 1 
9. 00 9.786 6 13. 235 2 13. 529 0 10. 029 1 
5. 00 6.055 8 8. 029 2 7.0224 9.767 5 
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图 3-11 四 种 方法 的 预测 趋势 

基于 表 3-12 和 图 3-11, 我 们 可 以 看 出 ,提出 的 联合 多 步 健 康 算法 在 设备 在 线 
健康 预测 方面 优 于 HSMM 方法 、 基 于 多 步 算法 的 HSMM 方法 和 基于 一 步 算法 的 
HSMM 方法 。 为 了 评估 这 四 种 方法 的 性 能 ,分 析 了 绝对 误差 标准 和 相对 误差 标 
准 。 绝 对 误差 是 指 在 预测 过 程 中 的 物理 误差 ,而 相对 误差 是 指 相对 于 原 有 的 实际 
值 、 预 测 值 的 优 劣 程度 。 对 于 绝对 误差 ,我 们 主要 分 析 均 方 根 误 差 (RMSE) .方差 
绝对 误差 (VAE) 和 平均 绝对 误差 (MAE)。 对 于 相对 误差 ,我 们 主要 分 析 平 均 绝对 
相对 误差 (MARE) 和 方差 相对 误差 (VRE)。 并 且 , 为 了 进一步 评估 这 四 种 方法 的 
性 能 ,相关 系数 (R) 也 被 分 析 。 上 述 绝对 误差 和 相对 误差 的 表达 式 如 下 : 


均 方 根 误差 (Erms ) : Erms = ESN 


平均 绝对 误差 (Ewa) :Ewa = Ll» 

i=1 
i EE ES 2 

方差 绝对 误差 (Ew):Ew 一 二 27 Gy — Eva) 

i=l 
a ERE: 
平均 绝对 相对 误差 (Evar): Evar 一 > 276: 
i=1 


方差 相对 误差 (Eve) Eg — +) Gi — Eua 
i=1 
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Dory 
i=1 


> (yi — y)? 之 (i — y» 

其 中 ,i 代表 了 观察 时 刻 点 ,n 是 总 的 观测 时 刻 点 的 数量 , g Ale; 分 别 表示 在 第 i 观 
察 时 刻 点 的 绝对 误差 与 相对 误差 。y; 和 y; 分 别 表示 在 第 i 观察 时 刻 点 的 实际 剩余 
寿命 值 与 预测 剩余 寿命 值 。y My 分 别 表 示 了 实际 剩余 寿命 值 的 平均 值 与 预测 剩 
余 寿 命 值 的 平均 值 。 

基于 上 述 六 个 误差 标准 ,HSMM 方法 .基于 多 步 算法 的 HSMM 方法 、 基 于 一 
步 向 前 算法 的 HSMM 方法 和 提出 的 联合 多 步 健康 预测 算法 的 评估 结果 如 表 3-13 
所 示 。 如 果 误 差 值 越 小 , 则 代表 着 该 方法 在 预测 方面 越 精确 。 基 于 表 3-13 中 的 
RMSE,MAE,VAE,MARE 和 VRE 的 值 ,我 们 可 以 看 出 ,所 提出 的 联合 多 步 健康 
预测 算法 的 预测 精度 优 于 HSMM 方法 .基于 多 步 算 法 的 HSMM 方法 和 基于 一 步 
算法 的 HSMM 方法 。 从 相关 系数 来 看 ,也 说 明了 提出 的 联合 多 步 健 康 预 测算 法 
的 预测 精 优 于 HSMM 方法 .基于 多 步 算法 的 HSMM 方法 和 基于 一 步 算法 的 
HSMM 方法 。 





相关 系数 (R): R 








表 3-13 四 种 方法 的 性 能 评估 结果 



































预测 方法 误差 标准 
RSME MAE VAE MARE VRE R 
基于 联合 多 步 算法 的 HSMM | 1.0341 | 0.940 8 | 0.1843 | 0.083 3 | 0.004 3 |0.9979 
基于 多 步 算法 的 HSMM 2.636 6 | 2.3594 | 1.3848 | 0.157 1 | 0.009 3 |0.9625 
基于 一 步 算法 的 HSMM 2.8083 | 2.560 7 | 1.3294 | 0.2213 | 0.023 8 |0.9876 
HSMM 4.3717 | 3.5709 | 6.3604 | 0.294 6 | 0.080 3 (0.9420 


对 于 整个 案例 ,基于 在 线 健康 预测 算法 和 可 用 的 观测 数据 ,可 以 进行 单 监测 信 
息 的 在 线 健康 预测 。 并 且 ,我 们 从 预测 结果 可 以 看 出 ,所 提出 的 联合 多 步 向 前 健康 
预测 算法 在 设备 的 在 线 健康 预测 方面 具有 很 好 的 性 能 ,包括 预测 精度 和 预测 性 能 。 
进一步 分 析 看 出 ,所 提出 的 联合 多 步 向 前 健康 预测 算法 与 HSMM 方法 相 比 , 在 处 
理 大 量 数据 时 ,计算 复杂 性 有 所 下 降 , 所 提出 的 联合 多 步 向 前 健康 预测 算法 的 预测 
精度 也 优 于 HSMM Jrik ^? .基于 多 步 向 前 算法 的 HSMM 方法 和 基于 一 步 向 
前 算法 的 HSMM 方法 。 所 提出 的 联合 多 步 向 前 健康 预测 算法 也 减少 了 计算 存储 
空间 。 经 过 上 述 分 析 可 以 得 出 ,在 设备 在 线 健 康 预 测 方面 ,所 提出 的 联合 多 步 向 前 
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健康 预测 算法 是 非常 有 效 的 。 


3.4 本 章 小 结 


本 章 基 于 SMC 方法 和 退化 HSMM ,提出 了 一 个 单 监测 信息 的 在 线 健康 预测 
模型 。 在 实际 的 应 用 过 程 中 , 某 一 个 单一 方法 或 者 模型 已 经 很 难 对 设备 进行 有 效 
的 健康 预测 ,因此 ,基于 HSMM 丰富 的 诊断 与 预测 结构 和 SMC 在 线 特征 ,结合 
每 个 方法 的 优点 ,提出 了 一 个 新 颖 的 联合 多 步 向 前 健康 预测 算法 ,从 而 消除 了 单一 
方法 所 带 来 的 缺点 。 并 且 ,发 展 了 在 线 设备 剩余 寿命 预测 模型 ,利用 当前 设备 的 健 
康 状 态 信息 ,可 以 有 效 地 计算 设备 剩余 寿命 预测 值 ,获得 设备 健康 发 展 趋势 。 通 过 
算 例 的 分 析 可 知 , 在 设备 健康 预测 领域 ,所 提出 的 联合 多 步 向 前 在 线 健康 预测 算 
法 ,通过 与 HSMM 多 步 向 前 算法 和 一 步 向 前 算法 进行 了 比较 ,结果 显示 ,本 章 所 
提出 的 联合 多 步 向 前 在 线 健康 预测 算法 ,在 预测 精度 、 预 测 复杂 性 等 方面 ,都 具有 
很 好 的 性 能 。 
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hill 


当前 ,计算 机 技术 高 速 发 展 , 在 军事 领域 和 工业 领域 ,多 监测 信息 (多 传感器 信 
息 ) 融 合 技术 得 到 了 广泛 的 关注 与 应 用 。 对 于 多 传感器 信息 融合 技术 的 应 用 ,可 以 
有 效 避 免 单一 传感器 的 局 限 性 和 信息 不 准确 性 ,多 传感器 可 以 获取 更 多 更 准确 的 
信息 ,基于 这 些 信息 ,可 以 得 出 更 精确 的 结论 。 多 监测 信息 在 战场 监视 飞行 器 导 
航 、 遥 感 技术 .目标 识别 ` 机 器 人 、 工 业 生产 ` 图 像 处 理 及 医疗 诊断 等 不 同 领域 已 大 
量 投入 应 用 。 

为 了 满足 生产 企业 对 设备 使 用 的 需求 ,在 单 监 测 信息 在 线 健 康 预测 的 基础 上 ， 
考虑 多 监测 信息 的 在 线 健康 预测 。 在 设备 实际 使 用 过 程 中 ,需要 发 展 一 种 以 设备 
的 健康 状态 为 基础 ,不 依赖 于 以 前 的 统计 数据 的 新 的 设备 维护 策略 及 设备 的 维护 
调度 策略 。 因 此 ,需要 考虑 设备 的 实际 运行 状态 ,为 维护 和 维护 调度 的 管理 层 提供 
有 效 维 护 活动 和 有 效 计划 所 需要 的 设备 健康 数据 ,在 设备 健康 状态 恶化 之 前 ,对 设 
备 进行 实时 的 处 理 , 以 避免 一 些 成 本 高 昂 的 大 修 ,降低 设备 的 失效 率 , 提 高 设备 的 
利用 率 ,降低 设备 的 维护 成 本 ,提高 企业 的 生产 率 。 在 此 目标 的 基础 上 ,有 必要 对 
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设备 进行 有 效 的 健康 预测 ,将 基于 多 传感器 获得 有 效 的 设备 健康 状态 信息 作为 维 
护 模型 和 维护 调度 模型 的 输入 参数 ,从 而 有 利于 发 展 设备 的 维护 模型 。 

基于 单 监测 信息 的 在 线 健康 预测 方法 ,本章 通过 建立 一 种 新 颖 的 处 理 多 监测 
信息 的 自 适应 隐 半 马尔 可 夫 模型 (AHSMM) ,对 设备 进行 有 效 的 健康 预测 。 首 先 ， 
对 于 退化 HSMM 的 基本 算法 进行 修正 ,获得 了 修正 的 HSMM 基本 算法 ,修正 后 
的 算法 在 处 理 多 传感器 信息 时 ,可 以 有 效 地 降低 模型 的 计算 复杂 性 和 空间 复杂 性 。 
其 次 ,对 于 设备 隐藏 的 衰退 状态 的 识别 ,最 大 似 然 线性 回归 变换 方法 被 用 于 训练 
AHSMM 的 输出 概率 分 布 和 状态 的 驻 留 概率 分 布 , 从 而 可 以 有 效 地 重新 估计 AH- 
SMM 的 未 知 参数 ,AHSMM 被 用 来 获得 和 计算 设备 健康 状态 间 的 转移 概率 和 设 
备 的 健康 状态 的 驻 留 时 间 。 最 后 ,基于 AHSMM ,发 展 了 一 种 健康 预测 模型 预测 
多 传感器 的 设备 健康 状态 ,并且 估计 设备 的 剩余 有 效 寿命 。 


4.2 ”特征 空间 降 维 


在 收集 多 传 感 的 监测 数据 后 ,需要 对 原始 数据 进行 预 处 理 , 并 且 , 需 要 对 预 处 
理 后 的 数据 进行 特征 提取 ,从 而 形成 一 个 数据 的 特征 向 量 集 合 。 在 初始 的 特征 提 
取 中 ,会 采集 大 量 的 数据 特征 值 ,而 大 量 的 特征 向 量具 有 高 维 性 质 , 会 造成 某 些 特 
征 向 量 非 常 相 关 ,导致 信息 重 麦 的 现象 。 因 此 ,为 了 对 基于 多 传感器 的 设备 进行 预 
测 和 降低 数据 元 余 性 ,需要 对 数据 进行 降 维 处 理 , 便 于 后 续 的 数据 分 析 , 降 低 模 型 
在 预测 过 程 中 的 计算 复杂 性 。 

在 进行 多 传感器 的 设备 健康 预测 方面 ,基于 合理 利用 多 传感器 监测 数据 的 目 
的 ,需要 对 监测 数据 进行 降 维 操作 和 简化 处 理 过 程 ,降低 多 传感器 监测 数据 的 维 
数 , 便 于 数据 进行 处 理 与 分 析 , 虽 然 数据 的 维 数 降低 了 ,但 是 ,通过 降 维 数据 而 获得 
的 预测 结果 的 精确 度 是 不 受 影响 的 。 本 章 应 用 多 元 统计 方法 PCA 来 对 数据 执行 
降 维 操作 ,通常 用 PCA 考察 模型 多 个 变量 之 间 的 相互 关联 性 ,还 可 以 应 用 监测 数 
据 的 少数 几 个 主 成 分 描述 模型 多 个 变量 之 间 的 内 部 特征 。 在 数据 处 理 过 程 中 ， 
PCA 主要 起 到 数据 压缩 及 解释 的 作用 。PCA 在 进行 数据 降 维 操作 过 程 中 ,具有 对 
数据 变异 较 小 的 变量 方向 进行 省 略 ,投射 传感器 检测 数据 到 一 个 不 大 的 空间 ,压缩 
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传感器 监测 数据 的 处 理 思 想 。PCA 在 进行 数据 降 维 操作 过 程 中 的 基本 步骤 如 下 。 
CD 标准 化 多 传感器 的 初始 检测 数据 矩阵 ,在 数量 级 或 量 纲 上 ,将 模型 变量 的 
影响 去 除 。 
(2) 针对 多 传感器 标准 化 的 数据 矩阵 ,执行 协 方差 或 相关 矩阵 的 求解 操作 。 
(3) 针对 获得 的 协 方差 或 相关 和 矩阵 ,执行 特征 根 与 特征 向 量 的 计算 操作 。 
(4) 对 正 交 向 量 进行 计算 ,从 而 来 表征 标准 化 后 的 输入 数据 ,获得 的 正 交 向 量 
即 为 主 成 分 ,因此 ,多 传感器 的 原始 监测 数据 可 以 被 认为 是 主 成 分 的 线性 组 合 。 
(5) 为 了 更 好 地 分 析 每 个 向 量 ,进行 按 重 要 程度 排序 主 成 分 的 操作 。 
(6) 为 了 重新 构造 多 传感器 的 原始 监测 数据 的 信息 近似 值 ,进行 基于 筛选 准 
则 保留 较 强 主 成 分 的 操作 。 


4.3 设备 在 线 健康 预测 方法 


4.3.1. 修正 隐 式 半 马 尔 可 夫 模 型 


对 于 AHSMM ,基本 参数 包括 初始 状态 概率 (x) ,状态 转移 概率 (A)、 观 察 值 概 
率 (B) ,状态 驻 留 (D)。 一 个 AHSMM 可 以 被 描述 为 4 二 (x,A,B,D)。 对 于 一 个 
给 定 的 健康 状态 i, 则 健康 状态 i 的 驻 留 是 4 ,A 是 健康 状态 之 间 的 转移 概率 矩阵 。 

与 HSMM 相似 ,AHSMM 也 存在 评估 识别 和 训练 这 三 个 基本 问题 。 在 
AHSMM 中 ,新 的 前 向 一 后 向 变量 被 重新 定义 ,发 展 了 新 的 前 向 一 后 向 算法 。 

为 了 降低 AHSMM 的 计算 复杂 性 ,传统 的 HSMM 基本 算法 需要 进行 改进 。 
为 了 执行 基本 HSMM 的 改进 ,定义 了 一 个 前 向 变量 a,(i,d), 它 表示 在 健康 状态 i， 
并 且 已 经 存在 驻 留 d, Gd) =d 的 情况 下 ,产生 01.0: ,0 的 概率 。 在 本 章 中 ,用 
es 表示 当前 健康 状态 g, 已 经 存在 的 状态 驻 留 。 

当 (g,,e,) 取 值 为 (i,d) 的 时 候 , 半 马尔 可 夫 链 将 保持 在 当前 健康 状态 i 直到 时 
间 : ,并 且 , 健 康 状态 i 已 经 存在 状态 驻 留 d ,在 时 间 :十 1 时 ,转移 到 其 他 健康 状态 。 
因此 ,对 于 1 三 1 过 TT 一 1,d € [1,Dj,i,j € S ,可 将 一 个 前 向 变量 定义 为 

a, (isd) = plo soz 0, qa] = L| A) = pot s lgie) = Gi.d)] (4-1) 
假定 a, (i,d) 已 经 被 确定 ,健康 状态 ;已 经 存在 状态 驻 留 4。 如 果 当 健康 状态 i 
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结束 的 时 候 , 产 生 观察 值 序列 os ,os ,…:,o, 则 需要 满足 下 列 条 件 。 
CD 在 当前 健康 状态 产生 观察 值 序列 o ,0s,… os [B w(i,d)]。 
(2) 从 健康 状态 j 到 健康 状态 i 被 选择 ( 即 aj )。 
(3) 在 健康 状态 j 的 状态 驻 留 被 选择 [ 即 Pi] 
(4) 在 健康 状态 i 的 04+1,04+s，… ,0 被 省 略 。 
则 可 以 获得 前 向 递归 方程 : 


N D 
» PEE d=1 


jTMj*i r=1 
wu id) = (4-2) 
d 
aa Gd —1) TIC) d>1 
s=1 
a (isd) = zibiCo) pid) (4-3) 
alid) = 0 r<1 (4-4) 


其 中 ,D 表示 所 有 健康 状态 中 的 最 大 状态 驻 留 。 
在 式 (4-2) 中 ,为 了 降低 AHSMM 的 前 向 方程 的 计算 复杂 性 ,需要 修正 观察 值 
概率 表达 式 , 因 此 ,观察 值 概率 的 修正 递归 关系 可 表示 为 


d 
loc» =b(0 Ui (s—D s-1,2.7.d.d € [1.D] 


Unis) = (=! (4-4) 
U,,(00—1 
给 定 模型 人 , 则 观察 值 O 的 概率 方程 见 下 式 : 
N D 
boOL| 2 = >) >)ar(iyd) (4-5) 
i=l d=1 
在 这 个 情况 下 , ar(i,d) 定义 为 
ar Gd) = ploy 102 0, qpr-aa 7] = i | A) (4-6) 


因此 , pOT | 20 是 所 有 ar(i,d) 的 和 。 
与 前 向 变量 相似 ,对 于 1 志 1 志 TT 一 1,4 € [1,D],i,j € S ,一 个 后 向 变量 可 以 
定义 为 
Bli,d) = plom 042 7507 | q ag = iA) = plom | (qi) = (i,d)) (4-7) 
假定 后 向 变量 B, Cj ,d) 被 确定 ,健康 状态 i 已 经 存在 状态 驻 留 a。 对 所 有 健康 
状态 和 所 有 可 能 的 状态 驻 留 求 和 , 则 后 向 递归 方程 可 以 被 表示 为 
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d 
BGsd) = Ba Gd +1) [[5(42 + 
s=1 


(4-8) 
N 
| >») Bas G- Das Db, e 
j-lj*i 
Brisd) =1 (4-9) 
BG,d)=0 >T (4-10) 


为 了 估计 健康 状态 和 重新 估计 模型 的 参数 ,基于 上 面 定义 的 前 后 向 变量 ， 
定义 观察 值 序列 和 在 给 定时 间 从 健康 状态 i 到 健康 状态 j (i 隆 站 的 一 个 转移 过 程 
的 联合 概率 ,因此 ,给 定 模型 * 和 观察 值 序列 Or ,当前 处 于 健康 状态 i( 已 存在 状 
态 驻 留 d) EG DRRR O, r MEE e 从 健康 状态 i 转移 到 健康 状态 j 的 
概率 的 联合 概率 。 具 体 的 方程 如 下 : 

&(i.j)-b(nrqa-iq-jla 
= plom sqi = i| A) plonrog = j | Aq = 650) 


amı (isd) plontoqi = j | Asqa = D 
(4-11) 


amı (isd)plq = j | àsq = i) plot | qe = 6522 


amı CGisd)ayp (or | q = isà) 


N 
oa D gG-Da; jos 


j= ji 


为 了 从 观察 值 序列 Our 估计 健康 状态 ,给 定 模型 》 和 观察 值 序列 O1,7 ,当前 处 
于 健康 状态 i( 已 存在 状态 驻 留 aD ,定义 健康 状态 i 和 O1,7 的 联合 概率 y?(i) ,基于 
方程 (4-11) ,对 于 X(i) 的 递归 方程 可 以 解 得 
HD = pla = i | oir) 
Ba = ig =i | 7A) + Dla Æ isq = i | onr à) 








= Pa Si | Or dA) — plan = isq Fi | OT A) + 
piga F isq =i | o1,7-A) (4-12) 
N N 
—yaG- 2 &Gjp-4 D EGD 


j=l jži j=1ljži 


N 
—yaG- D EGED —&G.D) 


j=l j#i 


D 
YiG) = Jald) t> (4-13) 


d=1 
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因此 ,基于 Viterbi 算法 ,健康 状态 g, 的 最 大 后 验 估计 可 以 通过 以 下 方程 获得 : 


q, — arg max p(q, — i | 074A) = arg max y? (i) (4-14) 
给 定 观察 值 O,， ， ,初始 状态 分 布 x 的 重信 方程 可 以 根据 下 列 方程 获得 ; 
= ie (4-15) 
2o 


=1 


状态 转移 概率 的 重 估 方 程式 是 从 健康 状态 i 转移 到 健康 状态 7 的 期 望 转移 次 
数 与 从 健康 状态 i 出 发 的 期 望 转移 次 数 的 比值 ,具体 表现 为 


~ DDEG) 

ay = = — (4-16) 
$3 y 
t=] d=1 


ppro hn ARAS HE BS ER (ay ) i,w,;z;、 状 态 输出 概率 分 
Hi tb C )) ARE EE RH (s Vineet HSMM BUB 3 ST DL ea SE. 
对 于 健康 状态 i, 状 态 输出 概率 分 布 是 均值 为 六 和 方差 矩阵 为 > 的 高 斯 分 布 , 状 
态 驻 留 概率 分 布 是 均值 为 m 和 方差 为 ci 的 高 斯 分 布 。 
b:(O)=N(O; p; Xi) (4-17) 
pi D — NCds miso; ) (4-18) 
基于 Baum-Welch 算法 ,参数 集合 4 的 重 估 方 程 表示 为 
3»»o 5 oO 


m ah (4-19) 


Sper (Da 
t d 
x if t 
E DDG) Nj (or 一 页) (o, — u)" 
2e d 


: A (4-20) 


2; Laid 
t d 

T 8 

2; avid 


m; = = (4-21) 
yyw 
t d 
T t 
D NY @ Cd — mi)’ 
6; E (4-22) 


23 956 
t d 
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基于 方程 (4-19) 和 方程 (4-20) ,观察 值 概率 密度 函数 可 以 被 获得 : 


b) = NOx» 91) (4-23) 
基于 方程 (4-21) 和 方程 (4-22) , 驻 留 概 率 密度 函数 可 以 被 获得 : 
pi(d) = N(d;mi,0;) (4-24) 


4. 3.2” 自 适应 隐 式 半 马 尔 可 夫 模 型 


对 设备 来 说 ,如 果 采 用 多 个 传感器 进行 监测 ,从 而 产生 多 传感器 的 监测 信息 ， 
健康 预测 就 可 以 达到 更 好 的 性 能 。 由 于 各 种 传感器 的 差异 ,数据 信息 需要 一 种 有 
效 的 融合 。 因 此 ,提出 了 基于 HSMM 的 自 适应 训练 算法 。 自 适应 训练 算法 的 基 
本 思想 是 使 用 最 大 似 然 线性 回归 (MLLR) 变 换 来 处 理 多 个 传感器 之 间 的 差异 。 同 
时 ,采用 MLLR 变换 集合 训练 了 一 个 规范 模型 。 

AHSMM 充分 利用 了 基于 HSMM 的 基本 修正 算法 ,包括 前 后 向 算法 、Viterbi 
算法 .Baum-Welch 算法 和 单 监测 信息 预测 算法 。 通 过 规范 模型 对 状态 输出 和 了 驻 
留 分 布 的 均值 向 量 进行 线性 变换 ,从 而 可 以 获得 传感器 s 的 状态 输出 和 驻 留 分 布 
的 均值 向 量 。 

b, (o? ) - NCOs us +E", 2),) (4-25) 

pb: (d)=N(d 58? m; +6, o’) (4-26) 

其 中 ,[ 0.60 JERAR s H nX at 1) HE SAR AS i HH MIC A Aa SI DE 

[0 , y O ] 是 传感器 * 的 1X2 维 的 状态 驻 留 概率 分 布 变换 矩阵 。7 是 nXn 维 的 
ABE. EO Fé n AERIS SE. [ous ,1]7 是 (2 十 1) 维 的 向 量 ,[z ,1]7 是 2 维 的 向 量 。 

让 S 表示 传感器 个 数 , O — CO, O° ) 表 示 监 测 数据 , O° = Corsets on ) 
表示 长 度 为 Ts 的 传感器 * 的 监测 数据 。 并且, 在 AHSMM 中 ,最 优 模型 参数 集合 
A 和 变换 矩阵 2 是 被 联合 估计 的 ,因此 ,基于 Baum-Welch 算法 的 参数 集合 A 的 重 
佑 方程 为 

- DD 2 P 
m = 一 一 € (4-27) 
2 b» Ayo? n jy? 





t 


s Ts t 
- $3 X NO M (-—uG» Con —u G2? 
» s 


t d 1 一 一 4+1 (4-28) 


s Ts t 
2,2; awd 
s t d 
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S Ts t 
DD XO & qdu-949) 
m, = — 4 — (4-29) 
2 2 i) 99 ? 
5 Ts eu 
IDDO qdu-mn i» 
g; = ++ 4 (4-30) 
BAARD 
s t d 


其 中 , m (s) = wet € om (s) =m + o 
BE YO = [^ ,£? ] fi X? = [8° O Jib Q — (QM yO) RRERE 
EQO = (Y? ,X9?) 表示 变换 矩阵 QD .对 于 变换 矩阵 Q ,基于 Baum-Welch 算 
法 的 重 估 方 程 为 
X? = [6 ,J9? ] 


Oe 5 > Eos dor «x2 x E Oder 
= [se = (Ebro: i PE (4-32) 
人 





| (4-31) 





Mao 
其 中 , g; = [m1] .& = [ET 。R 代表 了 分 享 相同 变化 矩阵 的 分 布 数 。 
$100 代表 了 矩阵 >), 的 第 个 元 素 。 
因此 ,基于 Viterbi 算法 和 单 监测 信息 健康 预测 算法 ,重新 估计 状态 w 的 最 大 
后 验 估计 。 


s 
a = arg max p (O | A) = arg max [T oco | a) (4-33) 
-1 


上 述 内 容 描述 了 HSMM 的 自 适应 训练 技术 。 对 于 设备 健康 预测 ,来 自 不 同 
传感器 的 信息 源 往 往 在 决策 中 扮演 不 同 的 角色 。 在 AHSMM ,通过 使 用 基于 
HSMM 的 最 大 似 然 线性 回归 的 适应 性 , 自 适 应 训练 进行 了 一 个 规范 模型 的 输出 和 
状态 驻 留 分 布 的 传感器 标准 化 。 在 提出 的 方法 中 ,解决 了 多 传感器 监测 数据 的 有 
效 融 合 问题 ,使 用 基于 HSMM 的 自 适应 训练 算法 来 处 理 每 个 传感器 信息 的 有 效 
融合 。 具 有 多 传感器 信息 的 AHSMM 健康 预测 的 总 体 框架 如 图 4-1 所 示 。 
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多 传感器 监测 信息 剩余 寿命 (RUL) 


4-1 多 传感器 监测 信息 的 健康 预测 框架 














4.3.3 剩余 有 效 寿命 预测 方法 


在 实际 应 用 领域 中 ,失效 率 (hazard rate,HR) 和 有 效 剩 余 寿 命 (residual useful 
life,RUL) 函 数 在 很 多 学 科 的 研究 中 都 会 涉及 [2 ,监测 数据 的 多 种 特性 都 可 以 
通过 它们 来 体现 。 

在 设备 的 寿命 分 析 过 程 中 ,HR 是 一 个 重要 指标 。HR 的 主要 内 容 包 括 以 下 几 点 。 

CD 设备 的 可 靠 度 函数 。 可 靠 度 是 指 一 定 的 条 件 下 和 一 定 的 时 间 内 ,设备 能 
正常 工作 的 概率 。 设 备 的 可 靠 度 是 与 时 间 相互 关联 的 ,在 较 短 的 时 间 内 ,设备 的 可 
靠 度 可 能 会 增 大 ,在 较 长 的 时 间 内 ,可 能 会 减少 。 用 R(1) 来 表示 设备 的 可 靠 度 
PRA. 

RG) = P< T).P € [0.1] 

CAU deis HE PM ALA. T 代表 了 整个 设备 的 寿命 。R(1) 表 示 了 在 
[0 ,如 时 间 段 内 设备 进行 正常 工作 的 概率 [ R(0) = 1,RCo 二 0]。 

(2) 设备 寿命 的 分 布 函数 。 在 一 定 的 时 间 内 和 一 定 的 条 件 下 ,设备 发 生 失 效 
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的 概率 , 称 为 设备 寿命 的 分 布 函 数 。 用 F(1) 表 示 设 备 寿命 的 分 布 函 数 , 则 Fa) 十 
RG) — 1,[F(0) = 0,F(o) — 1]. 

(3) 设备 失效 概率 的 密度 函数 。 当 上 一 0 时 , FO) = 0 ,并且 , fO — F CO 存 
在 , 则 ,我 们 称 GO 为 设备 失效 概率 的 密度 函数 。f(7) 主要 说 明了 在 单位 时 间 的 时 
刻 点 上 ,设备 发 生 失 效 的 概率 。 

(4) 设备 的 HR 函数 。 到 时 刻 1 为 止 ,还 没有 失效 的 设备 在 时 刻 1 之 后 的 单位 
时 间 内 发 生 失 效 的 概率 , 称 为 HR 函数 。 用 4(1) 表示 HR 函数 。 

Ak(t) dk (t) _ dk(t)/M 


At) = lim ry aye [N-—ED]à I- FG) 
ao 


N 表示 监测 样本 总 数量 , RO) 为 在 时 刻 : 之 前 发 生 失 效 的 样本 总 数量 。 在 时 
间 间 隔 Cet + AO 中 ,失效 的 样本 数量 用 AR(:) RRE, 
(5) 设备 的 RUL 函数 。 当 设备 处 于 时 刻 1 时 ,到 设备 失效 时 刻 之 间 的 期 望 值 ， 
称 为 设备 的 RUL, 用 ma) 来 表示 。 
m = ET =: | T7 0 = /RO [Rade RO 0 


ACO de 表示 设备 到 4 时刻 时 ,没有 发 生 失 效 , 但 是 在 时 间 间 隔 Cet 十 At) 发 生 
失效 的 条 件 概 率 525 。 

某 台 设备 在 到 达 其 失效 状态 前 ,经 历 过 其 他 的 健康 状态 i(i 二 1,2,…,n 一 1)。 
DG) 是 设备 在 健康 状态 i 的 时 间 驻 留 长 度 ,基于 方程 (4-29) 和 方程 (4-30),D(CD) 可 
以 被 描述 为 








= f(t)/R@) 





DG) = mCi) + po? (i) 
N N 

p= [r- Xo] Meo) 
i=l i=1 


当 设 备 进 入 健康 状态 i 后 ,RUL 是 设备 停留 在 当前 健康 状态 i 的 剩余 时 间 驻 
留 与 后 续 所 有 经 历 的 健康 状态 的 驻 留 时 间 之 和 。 基 本 计算 结构 如 图 4-2 所 示 。 

让 D(i,d) 表示 设备 停留 在 当前 健康 状态 i 且 已 经 历 过 的 时 间 驻 留 为 a 的 
剩余 有 效 时 间 驻 留 。 当 设备 在 时 间 c 进入 健康 状态 i 时 ,在 时 间 间 隔 (+dAt， 
t 十 (4d 十 1)At) 中 ,失效 率 的 条 件 概率 被 定义 为 在 将 来 的 时 间 Ac 内 设备 从 健康 状态 
i 转移 到 其 他 任何 状态 的 概率 与 在 时 间 (z 十 AD) 设 备 仍然 停留 在 当前 健康 状态 i 的 
概率 的 比值 。 因 此 ,失效 率 的 条 件 概率 表示 为 


iG Any Ae — (设备 在 接 下 的 时 间 At 中 状态 转换 到 任意 其 他 状态 的 概率 ) 
REAGE dA) 仍旧 停留 在 状态 i 的 概率 ) 
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图 4-2 基于 具有 多 传感器 信息 的 寿命 框架 
这 里 d 表示 设备 进入 状态 i 后 的 已 经 历时 间 驻 留 , 满 足 条 件 








QrtaT drt2aT dd Qrt+daT 1 
设备 的 可 靠 度 函数 R(L 十 dAt) 表示 了 在 时 刻 1 十 dAt ,设备 仍然 停留 在 当前 健 
康 状态 i 的 概率 , 则 
RGU+dAt) = și) 
A+ dADAt = & Gij) /Xi) (4-34) 
基于 方程 (4-33), D(i,d) 表示 为 
DG.d) = DDA —AG--dADAD = DUA —8&G.j)/Y!(G)) (4-35) 
基于 方程 (4-33) 和 方程 (4-34) ,在 设备 进入 状态 i 后 ,并 且 已 经 历 的 时 间 驻 留 
H d 时 ,对 应 的 有 效 剩 余 寿命 可 以 计算 如 下 


(4-36) 

本 章 所 提出 的 方法 被 用 于 识别 多 监测 信息 的 设备 健康 状态 和 估计 剩余 有 效 寿 
命 。 通 过 与 失效 率 结合 的 AHSMM ,设备 健康 预测 算法 的 计算 步骤 如 下 。 

第 一 步 ,基于 AHSMM 的 训练 算法 ,获得 设备 健康 状态 的 初始 状态 转移 概率 
和 健康 状态 的 驻 留 时 间 。 

第 二 步 ,通过 AHSMM 的 参数 估计 ,获得 每 个 健康 状态 的 驻 留 概 率 密度 函数 ， 
在 此 基础 上 ,计算 每 个 健康 状态 的 驻 留 均值 和 方差 可 以 。 

第 三 步 , 基 于 修正 的 前 后 向 算法 ,识别 设备 的 当前 健康 状态 。 

第 四 步 ,基于 方程 (4-34) ,计算 失效 率 函 数 。 


N 
RUL«o = DG.d) + 24 DG) 
了 一 计 1 
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第 五 步 ,基于 方程 (4-35) ,计算 设备 停留 在 健康 状态 i 且 已 经 历时 间 驻 留 为 d 
时 的 期 望 剩余 有 效 驻 留 。 

第 六 步 ,基于 方程 (4-36) , 当 设 备 进 入 健康 状态 i 时 ,预测 在 第 d 个 观测 时 刻 点 
的 设备 剩余 有 效 寿命 RUL。 


4.4 E Pil oy pr 


以 第 三 章 的 液压 泵 (设备 ) 为 研究 对 象 ,对 本 章 内 容 进 行 分 析 。 利 用 多 传感器 
监测 信息 ,进行 设备 的 多 监测 信息 在 线 健康 预测 ,在 案例 分 析 中 ,将 预测 结果 与 设 
备 的 实际 结果 相 比 较 。 对 提出 的 方法 进行 分 析 , 说 明 提 出 方法 在 多 监测 信息 在 线 
健康 预测 方面 的 有 效 性 。 数 据 分 析 平 台 为 VC ,运行 环境 为 Windows XP. 

对 于 本 章 的 多 监测 信息 ,除了 第 三 章 中 的 液压 泵 的 振动 信息 外 ,还 包括 液压 泵 
的 温度 信息 ,油膜 信息 和 压力 信息 。 采 用 液压 泵 总 计 42 组 数据 来 描述 液压 泵 的 全 
寿命 过 程 。42 组 原始 监测 数据 的 RMS 描述 液压 泵 的 状态 变化 趋势 如 图 4-3 所 示 。 
从 图 4-3 中 可 以 看 出 ,在 初始 监测 阶段 ,RMS 显示 了 稳定 的 操作 阶段 。 随 着 状态 
的 不 断 发 展 ,有 一 些 强 的 变化 阶段 随 观 察 时 间 点 的 增长 ,包括 在 第 11 个 观察 时 间 
点 有 一 个 强 的 变化 阶段 ,在 第 21 个 观测 时 间 点 有 一 个 强 的 变化 阶段 ,在 第 31 个 观 
察 时 间 点 有 一 个 强 的 变化 阶段 。 这 些 点 可 以 被 描述 为 状态 转移 点 。 因 此 ,基于 这 
些 状态 转折 点 ,液压 泵 可 分 为 四 种 状态 ,包括 好 (Baseline)、 中 (Degradation 10,25 
(Degradation 2) Jf (Failure) 。 


4.4.1 数据 准备 


对 于 案例 中 液压 泵 的 健康 预测 分 析 ,来自 4 个 传感器 的 监测 数据 被 用 来 预测 
设备 的 健康 。 一 个 具有 4 个 健康 状态 的 AHSMM 被 训练 ,其 中 ,对 于 4 个 健康 状 
态 之 间 的 状态 转移 概率 , 则 是 液压 泵 初始 运转 过 程 中 的 转移 概率 ,对 于 每 个 健康 状 
态 的 驻 留 时 间 的 期 望 值 ,也 可 以 经 过 HSMM 的 训练 得 到 。 对 于 健康 状态 转移 概 
率 和 健康 状态 的 驻 留 时 间 期 望 值 分 别 如 表 4-1 和 表 4-2 Bron. 
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观测 时 刻 点 
图 4-3 监测 数据 的 变化 趋势 


表 4-1 健康 状态 间 的 原始 转移 概率 














健康 状态 好 中 差 坏 
好 0. 890 3 0. 108 9 0. 000 6 0. 000 2 
中 0 0.719 4 0. 280 2 0.000 4 
差 0 0 0. 981 6 0. 018 4 
坏 0 0 0 1 


表 4-2 ”健康 状态 期 望 驻 留 时 间 























健康 状态 好 中 Ed 坏 
驻 留 均值 10.635 1 9.675 3 11.543 2 — 
驻 留 方差 1.9291 1.0581 1.2841 — 
D(hi) 10. 700 9 9.713 3 11. 585 8 = 
在 本 案例 中 ,对 于 每 一 健康 状态 观测 时 刻 点 ,液压 泵 的 历史 健康 状态 趋势 如 





图 4-4 所 示 , 其 中 ,对 于 坐标 轴 y,1 表示 好 ,2 表示 中 ,3 表示 差 ,4 表示 坏 。 从 图 4-4 
中 可 以 看 出 ,液压 泵 的 健康 状态 随 着 时 间 的 变化 , 呈 衰 退 趋势 。 


4.4.2 在 线 健康 状态 识别 分 析 
基于 训练 后 的 AHSMM ,不 同 操作 条 件 下 的 实验 数据 被 用 于 验证 提出 的 状态 
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图 4-4 原始 健康 数据 的 状态 演化 


识别 方法 的 精确 度 。 每 一 个 健康 状态 包含 10 个 实验 数据 的 样本 ,以 验证 AHSMM 
的 有 效 性 。 

在 AHSMM 中 ,可 以 获得 4 个 健康 状态 的 输出 概率 和 状态 驻 留 概率 ,在 模型 训 
练 过 程 中 ,程序 中 设置 训练 的 最 大 和 迭代 步 数 为 45 ,收敛 误差 限定 在 e=0. 000 001, Xf 
液压 泵 进行 AHSMM 训练 时 ,一 般 经 过 20 步 左 右 的 迭代 过 程 都 能 收敛 。 

基于 AHSMM ,液压 泵 的 四 种 健康 状态 AHSMM 训练 曲线 如 图 4-5 所 示 。 其 
中 工 轴 代表 了 训练 步 数 ,y 轴 代 表 了 不 同 健康 状态 的 似 然 概率 。 基 于 图 4-5, 随 着 
模型 迭代 次 数 不 断 增加 ,对 于 设备 每 个 健康 状态 的 似 然 概率 对 数值 ,它们 都 是 逐渐 
收敛 的 。 这 说 明了 AHSMM 具有 快速 学 习 能 力 和 强 的 实时 信号 处 理 能 力 。 


=5. 





1 
e 


似 然 概率 对 数值 
1 


























0 5 10 15 20 30 35 40 45 50 


25 
训练 步 数 
4-5 四 种 状态 的 AHSMM 训练 曲线 
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基于 方程 (4-33) ,在 完成 设备 健康 状态 的 AHSMM 的 训练 后 ,可 以 得 到 液压 
泵 每 个 健康 状态 的 似 然 概 率 值 ,从 而 ,AHSMM 的 健康 状态 识别 的 模型 库 被 获得 。 
通过 利用 本 章 中 的 修正 Viterbi 算法 ,获得 液压 泵 健康 状态 的 特征 向 量 序列 在 
AHSMM 健康 状态 识别 模型 库 中 每 个 识别 模型 下 所 输出 的 似 然 概率 对 数值 。 每 
个 健康 状态 的 最 大 输出 概率 作为 该 状态 的 故障 类 型 。 对 于 每 个 健康 状态 的 观测 样 
本 在 分 类 器 中 输出 的 似 然 概率 对 数值 如 图 4-6 所 示 。 
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样本 样本 
(a) 基于 AHSMM 的 健康 状态 好 的 似 然 概率 对 数值 (b) 基于 AHSMM 健 康 状态 中 的 似 然 概率 对 数值 



































© T ASM RAE RSE LAR RR (d) I TPAHSMM EENEI SIRAI OR RA 
4-6 ”不同 健康 状态 的 似 然 概 率 对 数值 比较 
基于 图 4-6, 可 以 获得 40 个 数据 样本 的 状态 识别 结果 ,具体 的 分 类 结果 如 
X 4-3 所 示 。 同 时 ,来 自传 感 器 1 的 分 类 结果 和 传感器 3 的 分 类 结果 也 如 表 4-3 所 
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示 。 从 表 4-3 中 看 出 ,AHSMM 的 识别 精度 是 100% ,也 就 是 说 , 自 适应 训练 很 好 
地 融合 了 多 个 传感器 的 信息 , 即 对 于 具有 多 传感器 信息 的 设备 健康 识别 ,AHSMM 
是 非常 有 效 的 。 在 下 一 节 中 ,将 进一步 讨论 AHSMM 的 健康 预测 功能 。 
表 4-3 ”健康 状态 识别 结果 






























































y 识别 
健康 状态 好 中 差 坏 WEK) 
好 10 0 0 0 100 
中 0 10 0 0 100 
AHSMM x 0 0 10 0 100 
坏 0 0 0 10 100 
总 精度 100% 

好 9 1 0 0 90 
中 0 9 1 0 90 
Mies zx 0 1 9 0 90 
坏 0 0 1 9 90 

总 精度 90. 00% 
好 9 1 0 0 90 
中 1 9 0 0 90 
| 0 0 9 1 | w 
坏 0 1 8 80 

总 精度 87.50% 





4.4.3. 在 线 健康 预测 分 析 


基于 4.3 节 , 建 立 了 四 个 健康 状态 的 AHSMM 的 预测 模型 ,为 了 测试 提出 的 
健康 预测 方法 ,首先 ,在 液压 泵 进入 健康 状态 “好 ”后 ,6 个 观测 时 刻 点 被 用 于 计算 
液压 泵 的 RUL 和 测试 AHSMM 的 性 能 。 在 液压 泵 进入 健康 状态 Baseline 后 , 按 
照 下 列 计算 步骤 来 计算 这 6 个 观测 时 刻 点 的 RUL, 

第 一 步 , 基 于 方程 (4-34) ,计算 从 第 1 个 时 刻 点 到 第 6 个 时 刻 点 的 AG 十 
dA) At ,计算 结果 如 下 所 示 : 

AG + 1At) At = 0.107 4 , AG H-2AD At = 0.137 2 , AG 3AD At = 0.183 5 , 
AG + AAD At = 0.219 4 , AG H- BAD At = 0.327 9 , AG + 6AD AL = 0.458 2 

第 二 步 , 计 算 液 压 泵 停留 在 状态 Baseline 的 期 望 剩余 驻 留 时 间 D(i,d) ,计算 

结果 如 下 所 示 : 
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D(1,1) = DA) —AG -1ADAD 
D(1,2) = DDA —AG3-2AD0AD 
D(1,3) = DODG —AG -3ADAD 
D(1,4) = DODG —AG + 4A) At) 
D(1,5) = DDA —AG-H-5ADOAD 
D(1,6) = DODGO —AG + 6At) At) 


ll 


ll 


ll 


= 10.6739 X (1— 0. 
— 10. 673 9 X (1— 0. 


10.673 9 X (1— 0. 
10. 673 9 X (1 — 0; 
10. 673 9 X (1— 0. 


| 


= 10.6739 x (1— 0. 


107 4) — 9. 527 5 
137 2) — 9. 209 4 
183 5) = 8.715 2 
219 4) = 8. 332 0 
327 9) = 7.173 9 
458 2) = 5. 783 1 


第 三 步 ,计算 RUL Gay ,计算 结果 如 下 所 示 


4 
RUL ay = D(1,1) + YDG) = 9.527 54-9. 843 7 + 11. 546 8 = 30. 918 0 


j=2 


4 
RUL a» = D(1,2) + $2 DG) = 9. 209 4 +9. 843 7 +11. 546 8 = 30. 599 9 


j=2 


4 
RUL a.» = D(1,3) + YDG) = 8.715 2 + 9. 843 7 + 11. 546 8 = 30. 105 7 


j=2 


4 
RUL ay = D(1,4) + YDG) = 8. 332 0 + 9. 843 7 + 11. 546 8 = 29. 722 5 


j=2 


4 
RUL a,» = D(1,5) + SDG = 7. 173 9 + 9. 843 7 + 11. 546 8 = 28. 564 4 


je 


RUL ae 











D(1.6)4 YDG) 5. 783 1 +9. 843 7 + 11. 546 8 = 27.173 6 
j=2 
然后 ,为 了 显示 预测 RUL 和 实际 RUL 之 间 的 关系 ,选取 6 个 观测 时 刻 点 进行 
两 者 比较 ,如 表 4-4 所 示 。 从 表 4-4 中 可 以 看 到 ,所 提出 的 健康 预测 方法 对 于 多 传 
感 器 的 液压 泵 健康 预测 是 非常 有 效 的。 其 中 ,相对 误差 根据 以 下 公式 获得 。 
FARR HE = 100% X | 实际 RUL 一 预测 RUL| /实际 RUL 


表 4-4 预测 RUL 和 实际 RUL 比较 结果 (6 个 观测 时 刻 点 ) 




















实际 RUL 预测 RUL 相对 误差 (%%) 
32. 000 0 30.918 0 3. 381 2 
31. 000 0 30.599 9 1.290 5 
30. 000 0 30. 105 7 0.352 5 
29.000 0 29. 722 5 2.491 5 
28.000 0 28.564 4 2.015 8 
27.000 0 27.173 6 0. 643 0 
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为 了 进一步 说 明 提出 的 健康 预测 方法 对 多 传感器 信息 的 液压 泵 在 线 健 康 预测 
有 一 个 更 好 的 性 能 ,从 6 个 观测 时 刻 点 扩展 到 29 个 观测 时 刻 点 来 说 明 这 个 模型 的 
性 能 。 因 此 ,基于 方程 (4-35) 和 方程 (4-36) ,计算 29 个 观测 时 刻 点 的 RUL 值 , 同 
时 ,预测 的 RUL 和 实际 RUL 如 表 4-5 所 示 。 预 测 的 RUL 和 实际 RUL 之 间 的 比 


较 结 果 也 如 图 4-7 所 示 。 基 于 表 4-5 和 图 4-7, 可 以 看 出 预测 的 RUL 和 实际 RUL 


之 间 的 相对 误差 是 非常 小 的 。 这 说 明了 液压 泵 的 剩余 有 效 寿命 通过 提出 的 方法 可 
以 很 好 的 获得 ,预测 的 设备 健康 状态 很 好 地 匹配 了 设备 的 实际 状态 。 
表 4-5 预测 RUL 和 实际 RUL 比较 结果 (29 个 观测 时 刻 点 ) 















































实际 RUL 预测 RUL | 相对 误差 (%) | 实际 RUL 预测 RUL | 相对 误差 (%) 
32.000 0 30. 918 0 3. 381 2 17. 000 0 17. 683 1 4.018 2 
31. 000 0 30. 599 9 1. 290 5 16. 000 0 17.254 7 7.841 9 
30. 000 0 30. 105 7 0.352 5 15. 000 0 13. 869 4 7.537 3 
29. 000 0 29.722 5 2.4915 14. 000 0 13.613 8 2.758 6 
28. 000 0 28. 564 4 2.015 8 13. 000 0 13.547 3 4.210 0 
27.000 0 27.173 6 0.643 0 12. 000 0 13.262 5 10.520 8 
26.000 0 25.632 7 1.412 7 11.000 0 12.816 4 16.512 7 
25. 000 0 24. 338 2 2.647 2 10. 000 0 9.857 9 1.4210 
24. 000 0 23.583 9 1.733 8 9.000 0 9.807 3 8.970 0 
23. 000 0 23.3718 1.616 5 8.000 0 9.2718 15.897 5 
22.000 0 22.195 2 0. 887 7.000 0 8.138 2 16. 260 0 
21.000 0 22.656 9 7.890 0 6.000 0 7.586 2 26.436 7 
20. 000 0 21.178 3 5. 891 5 5. 000 0 5. 809 3 16. 186 
19. 000 0 18. 694 3 1. 608 9 4. 000 0 5.4137 35. 342 5 
18. 000 0 18. 157 6 0. 875 6 

















4.4.4 预测 性 能 评估 


通过 本 章 提 出 的 健康 预测 方法 ,可 以 很 好 地 预测 多 传感器 信息 的 设备 健康 。 
同时 ,为 了 说 明 AHSMM 对 于 多 传感器 信息 的 设备 健康 预测 有 很 好 的 性 能 ， 
HSMM 方法 也 被 用 于 预测 多 传感器 信息 的 液压 泵 的 健康 ,并 且 与 AHSMM 及 单 
监测 信息 的 健康 预测 进行 了 性 能 比较 。 预 测 结果 如 表 4-6 所 示 , 并 且 , 对 应 的 比较 
结果 如 图 4-8 所 示 。 从 表 4-6 和 图 4-8 中 可 以 看 出 ,与 HSMM 相 比 ,在 处 理 多 传 感 
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35 


0 


目 实 际 RUL 
@ 预 测 RUL 


0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 
观测 时 刻 点 


图 4-7 基于 AHSMM 的 预测 RUL 和 实际 RUL 比较 结果 
器 信息 的 健康 预测 方面 ,AHSMM 具有 更 好 的 预测 性 能 ,并 且 , 多 监测 信息 的 健康 
预测 精度 优 于 单 监测 信息 的 健康 预测 精度 。 
































表 4-6 三 种 方法 的 预测 结果 
实际 AHSMM 单 监测 信息 预测 模型 HSMM 
RUL 预测 相对 预测 相对 预测 相对 
RUL 误差 (%) RUL 误差 (%) RUL 误差 (%) 
30 30.1057 0.352 5 29. 398 2.0067 | 30.2558 0.852 7 
26 25.632 7 1.412 7 25. 214 2 3.0223 | 29.9643 | 15.247 3 
22 22.195 2 0. 887 22.517 2 2.3509 | 29.795 4 | 35.4336 
17 17. 683 1 4.018 2 17.513 4 3.02 19.498 1 | 14.6947 
15 13. 869 4 7.537 3 16.077 6 7. 184 19.2081 | 28.054 
12 13.2625 | 10.5208 13.162 5 9.687 5 | 18.866 6 | 57.2217 
1 12.816 4 | 16.5127 12. 966 7 17.879 1 | 10.2471 6. 844 5 
9 9. 807 3 8.97 9. 786 6 8.74 10.029 1 | 11.4344 
5 5.8093 | 16.186 6.055 8 21.116 9.767 5 | 95.35 




















基于 这 五 种 误差 标准 , 单 监测 信息 健康 预测 方法 .HSMM 和 AHSMM 的 性 能 





评估 结果 如 表 4-7 所 示 。 并 且 , 五 种 误差 比较 的 结果 如 图 4-9 所 示 。 从 表 4-7 和 


图 4-9 的 三 种 方法 的 绝对 误差 和 相对 误差 可 以 看 出 ,对 于 处 理 多 传感器 信息 的 设 


-104— 











图 4-8 
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单 监测 信息 预测 模型 














4 5 6 
观测 时 刻 点 
三 种 方法 预测 的 比较 结果 
备 健康 预测 ,AHSMM 明显 优 于 单 监 测 信息 的 健康 预测 模型 和 HSMM, 















































R47 三 种 方法 的 性 能 评估 结果 
方法 - 一 
RSME MAE VAE MARE VRE 
AHSMM 0.950 4 0.797 5 0.167 2 0.073 8 0.003 4 
单 监测 信息 预测 模型 1.034 1 0. 940 8 0. 184 3 0. 083 3 0. 004 3 
HSMM 4.3717 3.570 9 6. 360 4 0. 294 6 0. 080 3 
AHSMM 
6L 单 监测 信息 预测 模型 
HSMM 
im 
S 
W 
E: 
E 
RSME MAE VAE MARE VRE 
误差 标准 
4-9 三 种 方法 的 误差 比较 结构 


通过 对 整个 算 例 的 分 析 , 基 于 AHSMM ,利用 多 监测 数据 信息 ,很 好 地 对 设备 


—-105- 


© 大 数据 驱动 的 设备 健康 预测 及 维护 决策 优化 


健康 进行 了 预测 。 并 且 ,结果 显示 ,在 处 理 多 传 感 占 信息 的 设备 健康 预测 方面 ,与 
HSMM 相 比 ,AHSMM 具有 更 好 的 预测 性 能 ,包括 预测 的 有 效 性 和 预测 的 准确 
性 。 对 于 单 监测 信息 健康 预测 ,多 监测 信息 的 健康 预测 具有 更 高 的 准确 性 。 而 且 ， 
通过 修正 HSMM 的 基本 算法 ,与 HSMM 相 比 ,AHSMM 还 降低 了 模型 的 计算 复 
杂 性 。 这 说 明 在 多 监测 信息 的 设备 在 线 健康 预测 领域 , AHSMM 是 非常 有 效 的 ， 
并 且 , 因 为 AHSMM 降低 了 模型 的 计算 复杂 性 ,AHSMM 还 可 以 被 用 在 实时 环境 
下 ,大 数据 的 多 监测 信息 的 在 线 健康 预测 。 





4.5 本 音 小 结 


设备 在 线 健康 有 效 预测 是 进行 维护 的 前 提 条 件 , 对 设备 的 健康 进行 合理 有 效 
的 分 析 与 建 模 , 有 助 于 为 维护 提供 有 效 的 设备 健康 信息 ,包括 设备 的 诊断 信息 和 设 
备 的 预测 信息 ,从 而 实现 设备 的 有 效 维护 ,降低 设备 的 维护 成 本 和 提高 企业 生产 
率 。 基 于 第 二 章 的 单 监 测 信息 在 线 健康 预测 方法 ,本 章 建 立 了 多 监测 信息 的 在 线 
健康 预测 方法 。 首 先 ,对 在 线 HSMM 进行 修正 ,提出 了 具有 较 低 计 算 复 杂 性 的 
HSMM 基本 算法 ,包括 修正 前 向 一 后 向 算法 、 修 正 的 Vitebi 算法 和 修正 的 BW 算 
法 。 其 次 ,对 修正 后 的 HSMM 进行 自 适应 训练 ,提出 了 自 适应 HSMM, 它 可 以 有 
效 地 融合 多 传感器 的 监测 信息 ,从 而 可 以 有 效 地 处 理 多 监测 的 设备 在 线 健康 预测 。 
最 后 ,提出 了 基于 失效 率 的 在 线 设备 剩余 寿命 预测 算法 。 通 过 案例 分 析 可 知 ,在 多 
监测 信息 的 设备 在 线 健康 预测 领域 ,AHSMM 与 单 监测 信息 的 在 线 健 康 预测 模型 
进行 了 比较 分 析 , 在 设备 健康 状态 识别 .设备 诊断 、. 剩 余 寿命 预测 和 计算 复杂 性 方 
面 ,AHSMM 具有 比 单 监测 信息 在 线 健康 预测 方法 更 好 的 性 能 ,因此 ,可 以 验证 
AHSMM 在 多 监测 信息 的 在 线 健康 预测 方面 是 非常 有 效 的 。 
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5.1 5| A 


第 4 章 讨论 了 基于 AHSMM 的 多 监测 信息 设备 在 线 健康 预测 问题 ,本 章 将 在 
此 基础 上 ,研究 一 种 基于 设备 在 线 健康 预测 的 集成 动态 维护 问题 。 这 种 维护 方式 
将 在 现实 生产 企业 中 得 到 非常 广泛 关注 与 应 用 。 

设备 维护 策略 优化 研究 始 于 20 世纪 50 年 代 , 是 维护 科学 的 重要 领域 之 一 
是 目前 的 研究 热点 问题 ,在 理论 和 应 用 上 取得 大 量 研究 成 果 。 Arii 
用 数学 工具 建立 的 优化 维护 策略 的 计算 模型 。 目 前 ,维护 优化 的 研究 对 象 涉及 维 
护 备件 的 管理 .维护 策 略 的 优化 与 选择 、 维 护 评价 、 维 护 管理 战略 等 :使 用 的 技术 方 
法 也 很 多 ,如 ANN 法 .运筹 学 . 贝 叶 斯 决策 分 析 、 随 机 过 程 . 应 用 数学 等 理论 。 为 
了 提高 模型 的 应 用 性 和 可 操作 性 ,使 用 了 大 量 的 历史 数据 和 统计 数据 作为 建 模 的 
数据 来 源 。 维 护 优 化 解决 的 基本 问题 是 何 时 对 系统 进行 维护 、 采 用 何 种 方式 维护 
及 维护 后 系统 功能 如 何 。 维 护 策略 优化 模型 是 以 寻找 维护 成 本 和 维护 效果 的 最 优 
平衡 为 目标 建立 的 数学 模型 ,合理 的 维护 策略 可 为 企业 的 设备 维护 工作 带 来 事 半 
功 倍 的 效果 。 
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设备 的 维护 策略 包括 维护 策略 的 确定 、 维 护 能 源 的 约束 、 维 护 动作 评价 、 维 护 
的 目标 管理 等 。 设 备 维护 模型 的 主要 目标 是 最 小 化 维护 成 本 和 最 大 化 维护 效果 ， 
合理 有 效 的 设备 维护 策略 有 助 于 企业 设备 利用 率 的 提高 .企业 生产 成 本 的 降低 和 
企业 生产 效率 的 提高 。 设 备 的 维护 效果 如 图 5-1 所 示 。 多 年 来 学 术 界 和 工业 界 都 
投入 了 大 量 精力 对 设备 系统 的 维护 策略 进行 了 深入 的 研究 ,针对 不 同 的 设备 系统 
及 相应 的 维护 需求 创建 了 各 类 行 之 有 效 的 维护 策略 ,不 少 策略 在 工业 界 得 到 了 广 
泛 应 用 。 
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图 5-1 维护 效果 


维护 ,又 称 为 维修 ,是 指 为 了 保持 或 恢复 设备 系统 使 其 处 于 正常 执行 预定 功能 
状态 ,而 进行 的 所 有 相关 技术 和 管理 活动 。 通 常 将 维护 分 为 事后 维护 (corrective 
maintenance,CM) 和 预防 维护 (preventive maintenance,PM) 。 事 后 维护 是 指 产品 
或 设备 系统 故障 后 使 其 恢复 到 规定 功能 状态 所 进行 的 全 部 活动 ,也 称 为 修理 。 预 
防 维护 是 指 通过 系统 的 检查 ,探测 和 预防 早期 故障 ,使 产品 或 设备 系统 保持 在 规定 
功能 状态 所 进行 的 全 部 活动 。 按 照 产品 或 设备 系统 工作 状态 的 恢复 程度 ,可 以 将 
维护 分 为 完全 维护 (perfect maintenance) .不 完全 维护 (imperfect maintenance) ,最 
小 维护 (minimal maintenance) 劣化 维护 (worse maintenance) 和 最 坏 维护 (worst 
maintenance) 五 类 。 维 护 的 目的 是 使 维护 后 的 设备 状态 较 停机 前 更 好 。 完 全 维护 
是 指 通过 置换 或 维护 使 设备 恢复 至 全 新 状态 ,不 完全 维护 是 指 通过 维护 动作 使 设 
备 恢复 到 较 佳 状态 。 设 备 停机 后 的 纠 错 维修 , 除 完全 与 不 完全 维护 之 外 ,还 可 能 仅 
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须 恢复 运作 即 可 , 即 进行 最 小 维护 ,使 设备 状态 恢复 至 与 停机 前 相同 ;也 可 能 因为 
急于 恢复 运作 ,而 造成 了 劣化 维护 ,使 设备 状态 反而 比 停机 前 略 差 ( 因 蔡 换 二 手 零 
件 或 程序 .技术 较 粗 糙 ) 。 无 论 是 预防 维护 或 纠 错 维修 ,如 果 维 护 动 作 不 当 或 效果 
不 如 预期 , 则 实际 结果 状态 可 能 比 目 标 状态 差 ,因此 也 可 能 成 为 最 坏 维护 ,实际 结 
果 为 设备 无 法 使 用 。 

设备 故障 对 生产 活动 的 影响 早 在 20 世纪 50 年 代 就 引起 了 人 们 的 注意 。 文 
gk 0 对 完备 的 预防 性 维护 进行 了 研究 ,对 系统 采用 周期 性 检修 的 方法 ,假设 维 
护 周期 不 变 。 但 在 实际 操作 中 ,由 于 预防 性 维护 并 不 能 使 设备 修复 如 新 , 随 着 维护 
次 数 及 系统 役 龄 的 增加 ,周期 性 维护 策略 不 可 避免 地 会 使 系统 的 可 靠 性 逐步 降低 ， 
而 使 维护 周期 中 出 现 故障 的 次 数 逐 步 增加 。 因 此 ,更 符合 实际 情况 的 应 该 是 随 着 
设备 使 用 时 间 的 增长 ,预防 性 维护 的 次 数 随 着 故障 次 数 的 增加 逐步 增加 。 文 
REST ?5 针对 非 完备 的 预防 性 维护 进行 了 研究 ,分 别 采用 不 同 的 方法 来 模拟 基于 改 
良 因 子 的 非 完备 维护 。Nakagawat29 考 虑 到 实际 的 可 操作 性 ,提出 了 三 种 建立 于 
参考 时 间 上 和 维修 周期 了 的 扩展 策略 。 如 果 故 障 在 :时刻 之 前 发 生 , 则 进行 小 修 ; 
如 果 设 备 到 了 周期 时 间 工 仍 在 运行 , 则 在 了 时 刻 进行 更 新 ;如 果 故 障 出 现在 : 和 工 
时 刻 之 间 , 则 可 以 从 三 种 策略 中 选择 执行 。 

目前 ,设备 的 维护 策略 可 以 分 为 以 下 五 类 。 

(1) 基于 设备 使 用 寿命 的 预防 性 维护 策略 。 基 于 设备 使 用 寿命 的 预防 性 维护 
策略 (age-dependent PM policy) 是 最 常用 的 维护 策略 之 一 ,该 策略 在 设备 到 达 它 
的 给 定 使 用 寿命 时 或 者 失效 时 进行 更 换 。 之 后 ,由 于 小 修 和 修复 非 新 研究 的 深入 ， 
不 少 学 者 对 这 一 策略 进行 了 拓展 229 。 但 是 ,以 上 的 研究 大 多 都 没有 具体 给 出 维 
修 /设备 更 换 时 间 的 计算 方法 ,只 是 简单 地 假设 寿命 服从 某 一 分 布 ,如 Weibull 分 
布 。Amarie? 中 对 设备 的 使 用 寿命 进行 了 重点 研究 ,在 寿命 下, 分别 给 出 了 设备 
更 换 时 间 的 上 限 和 下 限 。 基 于 设备 使 用 寿命 的 预防 性 维护 策略 一 直 是 维护 领域 的 
研究 人 员 的 研究 热点 ,也 已 有 了 不 少 研究 成 果 。 

(2) 周期 预防 性 维护 策略 。 周 期 预防 性 维护 策略 (periodic policy, PM) 是 指 依 
照 固定 的 时 间 间 隔 对 设备 进行 预防 性 维护 。 周 期 预防 性 维护 策略 可 分 为 故障 小 修 
周期 更 新 策略 和 块 更 新 策略 (block replacement) 两 类 。 故 障 小 修 周期 策略 是 指 设 
备 故障 时 采用 小 修 的 方式 解决 ,达到 预 设 的 时 间 时 则 更 换 设备 。 文 献 25 提 出 的 策 
略 是 ,设备 更 换 只 在 维护 周期 T 时 刻 时 发 生 , 周 期 期 间 若 发 生 故 障 只 进行 小 修 。 
当 故 障 次 数 大 于 或 等 于 预先 设 定 的 故障 次 数 时 ,在 下 一 个 维护 周期 时 , 则 应 该 更 换 
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设备 。 文 献 * 中 中 ,设备 以 固定 间隔 了 进行 预防 性 维护 ,期 间 出 现 故障 时 执行 小 修 
动作 , 当 寿 命 到 达 预 设 时 间 时 则 更 换 设备 , 预 设 时 间 与 修复 非 新 的 次 数 相 关 。 块 更 
新 策略 是 指 设备 在 预先 设 定 的 时 间 内 进行 一 系列 更 新 。 文 献 ® 中 的 策略 是 在 不 考 
虑 设备 寿命 的 情况 下 ,设备 在 维护 周期 了 前 发 生 故 障 时 ,不 更 换 设备 。 文 献 C%9 指 
出 可 采用 二 手 设备 对 故障 设备 进行 更 换 , 当 设备 寿命 大 于 预先 给 定 的 时 间 时 ,更 换 
二 手 设备 ;否则 ,更 换 全 新 设备 。 也 有 不 少 学 者 把 这 两 类 策略 进行 合并 研究 2?250 。 
由 于 周期 预防 性 维护 策略 具有 实施 方便 、 可 操作 性 强 等 特点 ,目前 仍 被 众多 企业 所 
普遍 采用 。 

(3) 不 定 周期 预防 性 维护 策略 。 与 周期 预防 性 维护 策略 不 同 ,不 定 周期 预防 
性 维护 策略 中 每 两 次 预防 性 维护 的 时 间 间 隔 是 不 相等 的 。 通 常 , 随 着 设备 使 用 年 
限 的 增长 ,预防 性 维护 的 时 间 间 隔 会 逐步 缩短 ,维护 周期 的 时 间 长 度 依赖 于 设备 的 
剩余 寿命 。 在 每 一 次 预防 性 维护 之 后 ,只 需要 确定 下 一 次 预防 性 维护 的 时 间 ,以 求 
将 维护 成 本 降 到 最 低 。Nakagawa25 提出 ,设备 故障 率 会 随 着 维护 次 数 的 增加 而 
增加 ,寿命 也 会 降低 ,设备 在 第 i 次 预防 性 维护 时 应 该 更 换 设备 ,所 有 在 预防 性 维 
护 之 间 发 生 的 故障 都 采用 小 修 来 解决 。 由 于 考虑 到 了 设备 的 预防 性 维护 周期 的 时 
间 间 隔 会 随 着 设备 使 用 年 限 的 增长 而 逐步 降低 ,因而 不 定 周期 的 预防 性 维护 策略 
更 具 可 操作 性 。 

(4) 失效 限制 策略 。 失 效 限 制 策略 (failure limit policy) 是 指 在 失效 率 或 其 他 
可 靠 性 指标 达到 一 个 预先 设 定 的 阔 值 时 进行 预防 性 维护 ,让 设备 在 某 个 可 接受 的 
可 靠 度 范围 内 和 运行。 文献 C59 通 过 对 设备 状态 进行 监测 的 方法 ,将 设备 的 状态 分 为 
持续 时 间 为 工 的 正常 阶段 和 持续 时 间 为 W 的 退化 阶段 。 预 防 性 维护 在 (T,T 十 W) 
之 间 进 行 ,并 且 修 复 如 新 。 如 果 设 备 在 (0,T) 之 间 出 现 故障 ,就 对 设备 立即 执行 修 
复 动作 , 且 修 复 如 新 。 文 献 中 提出 了 失效 限制 条 件 下 的 维护 成 本 优化 策略 , 预 
防 性 维护 期 间 出 现 的 故障 均 执 行 小 修 动作 。 文 献 C4255 都 研究 了 失效 限制 策略 
下 的 状态 监测 间隔 周期 的 优化 工作 。 文 献 Css259 对 维护 决策 的 算法 模型 进行 了 
优化 ,提高 了 计算 速度 ,增加 了 维护 模型 的 实用 性 。Bergman5255 对 失效 限制 策略 
进行 了 总 结 ,并 指出 设备 失效 率 通 常 是 设备 的 某 些 状 态 变量 的 函数 ,如 老化 程 
度 、 累 计 损 坏 程度 .累计 负载 等 ,决策 的 准则 是 在 保证 设备 失效 率 水 平 的 条 件 下 ， 
使 设备 的 维护 成 本 最 小 化 。 目 前 ,在 这 类 策略 中 , 仍 可 以 进行 许多 算法 的 优化 
工作 。 

(5) 维修 限制 策略 。 维 修 限制 策略 (repair limit policy) 根 据 对 修复 时 间 和 修 
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复 费 用 的 限制 分 为 两 类 。 修 复 费用 限制 策略 提出 于 19 世纪 60 4E RC ,在 该 策略 
下 , 当 设 备 发 生 故 障 时 ,估算 修复 费用 ,如 果 修 复 费 用 在 预 设 的 可 接受 范围 内 ,执行 
修复 动作 ,否则 ,更 换 设备 。 文 献 ”” 针 对 修复 非 新 的 情况 ,对 维修 次 数 的 优化 
问题 等 进行 了 讨论 。 文 献 2s9 提出 以 维护 成 本 率 作 为 费用 限制 的 阔 值 ,在 成 本 率 达 
到 某 一 韶 值 时 更 换 设 备 ,之 前 则 进行 维修 。 修 复 时间 限 制 策略 于 19 世纪 70 年 代 
中 期 提出 所 5 ,如 果 故 障 修复 时 间 超 过 了 某 一 阔 值 i, 不 再 进行 维修 ,更 换 设备 。 文 
献 C55 通 过 非 参 数 估计 方法 优化 维修 时 间 阔 值 的 估计 值 。 文 献 沁 5 提出 当 设备 出 现 
故障 ,修复 工作 马上 开始 ,如 果 修 复 能 在 1 时刻 内 完成 ,完成 修复 动作 ;否则 ,拆除 
设备 ,订购 新 设备 ,设备 到 达 后 更 换 设备 。 

设备 备件 占用 资金 的 减少 是 企业 盘活 资金 .降低 成 本 的 重要 手段 。 备 件 管理 
是 为 了 按 计划 进行 设备 维修 ,缩短 修理 停机 时 间 ,减少 修理 费用 而 对 备件 的 计划 、 
生产 .订货 ,采购 .储存 供应、 合理 使 用 等 方面 进行 的 业务 工作 。 备 件 管理 是 维护 
工作 的 重要 组 成 部 分 ,科学 地 储备 和 供应 备件 ,不 仅 有 助 于 按期 完成 维护 工作 ,而 
且 能 够 降低 备件 库存 费用 ,提高 经 济 效益 。 许 多 学 者 对 备件 库存 问题 Ce ?进行 了 
研究 。 文献” 针对 需求 量 较 低 的 贵重 备件 库存 成 本 进行 了 研究 ,考虑 了 备件 故障 
导致 的 贵重 设备 工作 不 正常 导致 巨大 缺 货 成 本 情况 。 文 献 Cs 研究 了 备件 需求 近 
似 指 数 分 布 的 备件 库存 问题 ,发 展 了 现 有 的 排队 论 库存 模型 ,同时 证 明了 此 方法 也 
能 应 用 于 优化 用 户 专用 的 备件 供应 问题 。 文 献 叶 设计 了 一 个 以 备件 缺 货 发 生 概 
率 为 约束 的 模型 ,目标 函数 是 使 库存 成 本 和 采购 成 本 最 小 化 。Hopp 等 学 者 考 
虑 了 订货 频率 和 综合 服务 水 平 ,并 提出 了 几 种 可 实施 的 启发 式 算法 ,并 明确 了 每 种 
算法 的 最 佳 应 用 条 件 。Roger 等 学 者 "研究 了 停止 生产 的 设备 备件 需求 的 库存 
决策 问题 。 文 献 中 将 备件 需求 分 为 关键 需求 和 非 关 键 需 求 , 建 议 对 关键 备件 采用 
保持 较 高 水 平 库 存 。 对 于 确定 订货 提前 期 的 泊 松 分 布 需 求 ,采用 连续 批量 存储 策 
略 , 而 且 通过 仿真 进行 了 验证 。 

许多 维修 模型 假设 系统 故障 后 不 能 维修 ,或 经 过 维修 后 能 恢复 到 设备 开始 的 
最 佳 状 态 ,但 对 很 多 实际 系统 来 说 这 些 假 设 一 般 是 不 成 立 的 。 在 大 多 数 情况 下 , 随 
着 设备 性 能 的 退化 ,执行 维护 后 可 能 只 会 使 设备 修复 到 故障 前 的 工作 健康 状态 ,或 
者 修复 到 某 个 更 好 的 工作 健康 状态 ,但 不 能 修复 如 新 。 此 外 ,对 于 部 分 维护 模型 ， 
在 维护 过 程 中 仅仅 讨论 了 单 故障 的 形式 ,而 在 设备 的 实际 运行 中 ,故障 的 形式 是 多 
样 化 的 ,针对 不 同 的 故障 ,采取 的 维护 方式 是 不 同 的 ,从 而 也 导致 了 不 同 的 维护 效 
果 , 因 此 多 故障 状态 系统 的 讨论 更 符合 实际 应 用 中 的 故障 模型 。 另 外 ,有 些 维护 模 
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复 费 用 的 限制 分 为 两 类 。 修 复 费用 限制 策略 提出 于 19 世纪 60 4E RC ,在 该 策略 
下 , 当 设 备 发 生 故 障 时 ,估算 修复 费用 ,如 果 修 复 费 用 在 预 设 的 可 接受 范围 内 ,执行 
修复 动作 ,否则 ,更 换 设备 。 文 献 ”” 针 对 修复 非 新 的 情况 ,对 维修 次 数 的 优化 
问题 等 进行 了 讨论 。 文 献 2s9 提出 以 维护 成 本 率 作 为 费用 限制 的 阔 值 ,在 成 本 率 达 
到 某 一 韶 值 时 更 换 设 备 ,之 前 则 进行 维修 。 修 复 时间 限 制 策略 于 19 世纪 70 年 代 
中 期 提出 所 5 ,如 果 故 障 修复 时 间 超 过 了 某 一 阔 值 i, 不 再 进行 维修 ,更 换 设备 。 文 
献 C55 通 过 非 参 数 估计 方法 优化 维修 时 间 阔 值 的 估计 值 。 文 献 沁 5 提出 当 设备 出 现 
故障 ,修复 工作 马上 开始 ,如 果 修 复 能 在 1 时刻 内 完成 ,完成 修复 动作 ;否则 ,拆除 
设备 ,订购 新 设备 ,设备 到 达 后 更 换 设备 。 

设备 备件 占用 资金 的 减少 是 企业 盘活 资金 .降低 成 本 的 重要 手段 。 备 件 管理 
是 为 了 按 计划 进行 设备 维修 ,缩短 修理 停机 时 间 ,减少 修理 费用 而 对 备件 的 计划 、 
生产 .订货 ,采购 .储存 供应、 合理 使 用 等 方面 进行 的 业务 工作 。 备 件 管理 是 维护 
工作 的 重要 组 成 部 分 ,科学 地 储备 和 供应 备件 ,不 仅 有 助 于 按期 完成 维护 工作 ,而 
且 能 够 降低 备件 库存 费用 ,提高 经 济 效益 。 许 多 学 者 对 备件 库存 问题 Ce ?进行 了 
研究 。 文献” 针对 需求 量 较 低 的 贵重 备件 库存 成 本 进行 了 研究 ,考虑 了 备件 故障 
导致 的 贵重 设备 工作 不 正常 导致 巨大 缺 货 成 本 情况 。 文 献 Cs 研究 了 备件 需求 近 
似 指 数 分 布 的 备件 库存 问题 ,发 展 了 现 有 的 排队 论 库存 模型 ,同时 证 明了 此 方法 也 
能 应 用 于 优化 用 户 专用 的 备件 供应 问题 。 文 献 叶 设计 了 一 个 以 备件 缺 货 发 生 概 
率 为 约束 的 模型 ,目标 函数 是 使 库存 成 本 和 采购 成 本 最 小 化 。Hopp 等 学 者 考 
虑 了 订货 频率 和 综合 服务 水 平 ,并 提出 了 几 种 可 实施 的 启发 式 算法 ,并 明确 了 每 种 
算法 的 最 佳 应 用 条 件 。Roger 等 学 者 "研究 了 停止 生产 的 设备 备件 需求 的 库存 
决策 问题 。 文 献 中 将 备件 需求 分 为 关键 需求 和 非 关 键 需 求 , 建 议 对 关键 备件 采用 
保持 较 高 水 平 库 存 。 对 于 确定 订货 提前 期 的 泊 松 分 布 需 求 ,采用 连续 批量 存储 策 
略 , 而 且 通过 仿真 进行 了 验证 。 

许多 维修 模型 假设 系统 故障 后 不 能 维修 ,或 经 过 维修 后 能 恢复 到 设备 开始 的 
最 佳 状 态 ,但 对 很 多 实际 系统 来 说 这 些 假 设 一 般 是 不 成 立 的 。 在 大 多 数 情况 下 , 随 
着 设备 性 能 的 退化 ,执行 维护 后 可 能 只 会 使 设备 修复 到 故障 前 的 工作 健康 状态 ,或 
者 修复 到 某 个 更 好 的 工作 健康 状态 ,但 不 能 修复 如 新 。 此 外 ,对 于 部 分 维护 模型 ， 
在 维护 过 程 中 仅仅 讨论 了 单 故障 的 形式 ,而 在 设备 的 实际 运行 中 ,故障 的 形式 是 多 
样 化 的 ,针对 不 同 的 故障 ,采取 的 维护 方式 是 不 同 的 ,从 而 也 导致 了 不 同 的 维护 效 
果 , 因 此 多 故障 状态 系统 的 讨论 更 符合 实际 应 用 中 的 故障 模型 。 另 外 ,有 些 维护 模 
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型 只 考虑 了 设备 的 退化 状态 或 者 老化 状态 ,没有 综合 两 种 衰退 信息 。 其 次 ,有 些 维 
护 模型 只 考虑 了 设备 的 备件 库存 ,没有 考虑 到 维修 人 员 对 设备 的 维护 模型 的 约束 
作用 。 因 此 ,鉴于 上 述 情况 ,本章 结合 前 两 章 中 单 监 测 信息 的 在 线 健康 预测 和 多 监 
测 信 息 的 在 线 健康 预测 ,提出 了 一 个 有 多 个 不 同 故 障 状态 的 设备 集成 动态 维修 策 
略 模型 ,充分 探讨 了 考虑 设备 诊断 信息 和 设备 预测 信息 的 设备 维护 问题 。 维 护 对 
象 性 能 的 退化 是 连续 的 进行 过 程 ,设备 状态 随 着 时 间 不 断 发 生变 化 。 通 过 第 3.4 
章 的 健康 指数 获取 及 划分 方法 ,可 以 将 系统 划分 为 多 个 离散 的 健康 级 别 , 将 一 个 连 
续 变 化 的 退化 过 程 简化 成 一 个 非 连续 的 过 程 。 状 态 间 的 转换 概率 可 以 从 训练 好 的 
AHSMM 中 输出 。 这 样 就 可 以 利用 状态 间 的 随机 转移 信息 ,使 用 离散 马尔 可 夫 链 
模型 来 描述 维护 对 象 的 退化 过 程 。 同 时 ,将 设备 划分 为 多 个 离散 的 健康 状态 ,研究 
了 设备 不 同 健康 状态 和 衰退 信息 对 维护 成 本 与 维护 时 间 的 影响 ,考虑 维护 风险 的 
影响 ,进一步 完善 了 设备 的 集成 动态 维护 模型 ,根据 设 定 的 目标 ,可 以 获得 最 优 的 
设备 维护 策略 ,满足 企业 的 生产 效率 要 求 , 降 低 企业 的 维护 成 本 ,提高 设备 的 利用 
率 ,延长 设备 的 使 用 寿命 。 


5.2 衰退 过 程 分 析 


设备 衰退 包括 设备 的 退化 与 老化 两 个 过 程 ,对 设备 来 说 ,如 果 没 有 经 过 任何 维 
护 , 它 不 会 转移 到 一 个 比 当 前 更 好 的 状态 ,而 是 转移 到 一 个 更 差 的 状态 。 比 如 一 台 
设备 ,如 果 在 使 用 过 程 中 ,没有 任何 的 维护 , 它 内 在 的 工作 机 制 就 会 发 生 退 化 ,或 者 
说 ,这 段 时 间 没 有 使 用 , 它 同样 会 发 生 内 在 机 制 的 一 个 退化 ,我 们 把 这 种 现象 称 为 
设备 的 退化 ,如 图 5-2 所 示 。 

在 本 章 中 ,使 用 上 三 角 转 移 概率 矩阵 来 描述 设备 的 退化 过 程 , 即 

P,-—j4|h4-—i0)-2e;-0,Vj«i 

设备 在 运转 过 程 中 , 随 着 使 用 时 间 的 增长 ,设备 出 现 磨损 ,老化 现象 随 之 发 
生 。 因 此 ,设备 的 故障 风险 就 会 增加 。 随 着 设备 的 持续 运转 ,会 越 来 越 转移 到 更 
差 的 健康 状态 ,我们 把 这 种 现象 称 为 设备 的 老化 ,如 零件 的 衔接 处 、 零 件 之 间 的 
配合 性 等 。 
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图 5-2 设备 的 退化 概率 转移 

基于 HSMM 的 设备 健康 预测 模型 设 定 状 态 之 间 的 转移 概率 仅仅 是 状态 依 
赖 的 ,这 就 是 说 ,设备 转移 到 较 差 状态 的 概率 不 会 随 着 设备 使 用 年 限 而 增加 的 。 
为 了 表达 设备 的 老化 现象 ,一 个 老化 因子 被 集合 到 HSMM rp dU ,这 个 老化 因 
子 说 明 随 着 使 用 年 限 的 增长 ,降低 了 设备 停留 在 当前 健康 状态 的 概率 ,而 增加 了 
设备 转移 到 一 个 较 差 状态 的 概率 。 通 过 一 个 迭代 算法 ,用 老化 因子 来 更 新 从 
HSMM 获得 的 初始 状态 概率 转移 矩阵 ,从 而 获得 新 的 状态 概率 转移 矩阵 。 尽 管 
设备 的 健康 状况 通过 采取 维护 措施 ,将 有 所 改变 ,但 是 通过 集合 老化 因子 的 
HSMM 所 获得 的 健康 状态 仍然 与 真正 的 设备 健康 状态 是 最 匹配 的 。 随 着 由 集 
合 老化 因子 的 HSMM 获得 设备 分 类 信息 ,可 以 确定 当前 的 设备 健康 状态 ,产生 
状态 转移 概率 。 

随 着 设备 使 用 年 龄 的 增加 ,设备 的 健康 状态 渐渐 地 转移 到 较 差 的 状态 ,这 
种 转移 表示 设备 在 后 续 使 用 过 程 中 ,会 更 加 容易 衰退 。 因 而 ,在 设备 的 衰退 过 
程 中 ,衰退 模式 分 为 递减 模式 (decrement mode) 和 钟 形 模式 (bell mode), 如 
图 5-3 所 示 。 递 减 模式 说 明 设 备 健康 状态 间 的 转移 概率 将 逐渐 降低 , 随 着 时 
间 的 增长 ,设备 将 逐渐 发 生 衰退 。 钟 形 模 式 说 明 设备 的 几 个 初始 健康 状态 
之 间 的 转移 概率 呈现 增长 的 趋势 ,后 续 设 备 健康 状态 之 间 的 转移 概率 呈现 
递减 趋势 。 
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图 5-3 设备 的 衰退 模式 
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5.3 维护 动作 与 维护 时 间 分 析 


按照 第 4 章 设 计 的 基于 HSMM 的 设备 故障 诊断 与 预测 模型 ,对 一 台 处 于 失效 
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机 制 下 的 设备 ,我 们 可 以 定义 工 个 不 同 的 状态 序列 :健康 等 级 一 1( 例 如 ,健康 状态 
指标 为 1 ,表示 为 h) 、 健 康 等 级 一 2( 表 示 为 hi vnm 健康 等 级 一 (L 一 1) (表示 为 
h 1-1) ,健康 等 级 一 L( 表 示 为 hi)。 这 里 ,等 级 一 L 标识 完全 失效 。 其 中 ,1 代表 正 
常 工作 状态 ,L 代表 失效 状态 ,等 级 2 至 等 级 工 一 1 表示 处 于 正常 状态 和 失效 状态 
之 间 的 退化 状态 。 则 系统 的 健康 状态 划分 为 状态 H= [1.2.7 L], M S EE 
状态 及 =i,i€E[1,2,… ,Lj 时, 称 设备 处 于 状态 h; ,设备 在 状态 h; 的 平均 持续 时 间 
W toos 

GB AR AS he E A XE FEE (T BY T VE E I Ea AE EE e E HE DUREE 
维护 ,也 可 选择 忽略 此 次 维护 时 机 ,不 采取 任何 动作 。 经 过 预防 性 维护 后 系统 的 改 
善 情况 分 为 两 部 分 :@ 通 过 修理 或 更 换 , 使 原 系 统 中 的 失效 零件 得 以 修复 ;@ 经 过 
任意 维修 方式 中 的 任意 一 种 ,使 未 失效 的 零件 性 能 得 以 改善 。 

为 了 减缓 设备 性 能 的 退化 ,可 以 采取 不 同 的 维护 动作 ,如 更 换 零 件 、 不 完全 维 
护 等。 根据 不 同 的 设备 退化 状态 ,采取 多 种 不 同 的 维护 动作 ,将 设备 状态 优化 至 不 
同 的 目标 值 。 为 了 体现 维护 动作 对 设备 的 改善 作用 ,本 章 将 设备 的 寿命 设计 为 真 
实 寿命 与 虚拟 寿命 。 设 备 的 真实 寿命 随 着 时 间 的 推进 而 自然 增加 ,不 受 维护 动作 
的 影响 ;而 虚 龄 会 因为 采取 了 不 同 的 维护 动作 而 一 定 程度 降低 , 即 设备 在 执行 了 维 
护 动作 以 后 ,设备 的 虚 龄 值 会 低 于 设备 的 真实 寿命 值 。 令 D(h;) 表 示 设 备 在 状态 
hi 的 驻 留 时 间 。 也 就 是 说 , 当 设 备 进 入 健康 状态 hi 后 ,设备 的 虚 龄 将 是 设备 停留 在 
健康 状态 hi 已 存在 的 有 效 驻 留 时 间 和 设备 停留 在 健康 状态 ;以 前 所 有 健康 状态 的 
已 存在 的 驻 留 时 间 之 和 。 

4 DG; n) 表示 在 第 个 维护 阶段 ,设备 进入 健康 状态 hi 后 ,已 经 存在 的 驻 留 
时 间 , 则 


D) = p) + po? (hi) (5-1) 
N N 

p= (r- Drao) Me (ai) (5-2) 
i=l i-1 

Dh; .n) = (0 —a;)DG;) (5-3) 


其 中 ,jy (1;) 是 健康 状态 hi; 的 驻 留 概率 密度 函数 的 均值 , o ?(h;) 是 健康 状态 h; 的 驻 
留 概率 密度 函数 的 方差 。T 表示 设备 的 全 寿命 , 且 T = >)" Dh). 

因此 ,基于 方程 (5-1) 一 方程 (5-3) ,在 第 nn 个 维护 阶段 ,可 以 计算 设备 进入 健康 
状态 h B MERE c, ,计算 公式 如 下 : 


=115- 


© 大 数据 驱动 的 设备 健康 预测 及 维护 决策 优化 


Dihin) EET 


ta = (5-4) 


DG; 2) + Spa» i1 

当 设 备 的 健康 状态 为 h; 时 ,有 多 种 不 同 的 维护 动作 可 以 选择 ,具体 的 维护 动作 
集合 表示 为 

PM; = {PMo ‚PM: ,PMg} U (PM; | 1& j (5-8) 
«i—l&cH)i-2,,.-.L-—1 
其 中 ， 

PM。 表 示 忽 略 设备 的 维护 ,不 采取 任何 维护 动作 。 

PM; 表示 设 备 的 保养 维护 (小 修 ) ,进行 润滑 调节、 除尘 等 一 般 性 保养 工作 ,使 
设备 停留 在 当前 状态 h; 的 概率 不 因为 设备 衰退 的 作用 而 降低 。 

PM, 表示 设备 的 维修 (大 修 ), 即 非 置 换 性 维护 ,对 设备 进行 修复 ,修复 部 分 部 
件 的 损耗 。 维 修 的 目的 就 是 让 设备 从 当前 健康 状态 hi 恢复 到 一 个 更 好 的 健康 状态 
hj ,在 这 种 情况 下 ,系统 的 虚 龄 将 降低 。 

PM 表示 设备 的 更 换 , 即 置换 性 维护 ,直接 用 新 的 零 部 件 更 换 发 生 故障 或 者 
损耗 的 设备 零 部 件 , 在 这 种 情况 下 ,设备 将 恢复 到 初始 健康 状态 hi 。 

根据 设备 具体 的 健康 状态 ,采取 不 同 的 维护 动作 ,将 设备 修复 到 不 同 的 目标 和 
不 同 的 健康 状态 ,如 图 5-4 所 示 。 因 此 ,不 能 忽略 设备 的 具体 维护 时 间 和 更 换 时 
间 , 大 量 地 采取 维护 动作 固然 可 以 保持 设备 的 可 靠 性 ,但 是 设备 的 利用 率 会 降低 。 
对 于 设备 的 利用 率 : 


A Total uptime 
u * - 
Total uptime + Total downtime 


7 i 

DMT. + >} Tana + 2) Tn + 2] T 
Au 表示 设备 利用 率 , Tu 描述 了 连续 采取 两 次 维护 间 的 工作 时 间 ( 是 连续 工 
作 时 间 段 的 标记 符号 ) Tom 是 执行 小 修 维护 PM, 所 需要 的 时 间 ,Tpw; 是 执行 维修 

动作 PM; 所 需要 的 时 间 , Ts 是 执行 置换 动作 PM, 所 需要 的 时 间 。 
在 本 章 中 ,采取 了 不 同 的 维护 动作 来 减缓 设备 的 衰退 ,包括 忽略 、 非 置换 性 维 
护 ,更换 等 。 除 了 忽略 和 更 换 维护 , 非 置换 性 维护 在 执行 维护 过 程 中 ,存在 一 定 的 
风险 。 也 就 是 说 ,在 执行 非 置换 性 维护 后 ,设备 不 一 定 会 修复 到 期 望 的 健康 状态 。 
例如 ,在 某 时 刻 , 当 设备 处 于 健康 状态 h; 时 ,采取 维修 动作 PM; 对 设备 进行 维护 
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时 间 
图 5-4 维护 时 间 关系 
后 ,预期 维护 目标 是 恢复 设备 的 健康 状态 到 一 个 期 望 的 更 好 的 健康 状态 hj; ,然而 ， 
在 采取 维护 动作 PM; 后 ,实际 的 健康 状态 h; 并 没有 恢复 到 期 望 的 健康 状态 hj, 而 
是 恢复 到 一 个 比 健康 状态 hj 差 的 状态 。 随 着 设备 寿命 的 增长 ,设备 将 出 现 退 化 和 
老化 现象 ,因此 ,设备 的 维护 风险 也 将 增加 。 也 就 是 说 ,实际 的 设备 维护 并 不 能 达 
到 期 望 的 维护 效果 。 





5.4 集成 动态 维护 模型 


5.4.1 基本 假设 和 符号 


针对 设备 的 性 能 退化 过 程 ,设备 的 生命 周期 根据 划分 规则 划分 为 多 个 健康 状 
态 ,提出 集成 的 动态 维护 模型 来 进行 设备 的 维护 决策 ,为 了 更 好 地 对 设备 进行 维 
护 , 对 维护 模型 的 一 些 基本 假设 如 下 。 

(D 基于 HSMM 的 诊断 和 预测 模型 ,获得 设备 的 实时 健康 状态 h € 
[1.2..L] 。 如 果 不 对 设备 执行 维护 动作 ,在 设备 的 寿命 增长 过 程 中 ,将 以 更 大 
的 转移 概率 向 更 差 的 状态 进行 转移 。 
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(2) 设备 是 被 定期 实时 监测 的 ,根据 新 的 设备 监测 数据 ,执行 相应 的 不 同 的 维 
护 动作 。 

(3) 设备 处 于 状态 i 时 ,选择 执行 的 维护 动作 有 : 

PM, = {PMo ,PM; PM} U (PM; |1<k<i—1,k€ S$}, 
i=2,3,.…,L—1 

当 设 备 进 入 故障 状态 工 时 , 非 置 换 性 的 维护 动作 不 能 再 被 采取 ,而 应 采取 相应 
的 更 换 维护 动作 。 

CA) 随 着 设备 寿命 的 增加 ,设备 将 转移 到 更 差 的 健康 状态 。 

(5) 如 果 在 时 刻 4, 不 采取 任何 维护 动作 , 则 在 此 时 刻下 ,设备 没有 维护 成 本 和 
维护 时 间 。 

(6) 设备 执行 置换 维护 时 ,不 管 设备 处 于 何 种 状态 ,采取 该 维护 动作 产生 的 成 
本 CR 与 置换 时 间 妇 不 会 发 生变 化 。 对 于 非 置换 维护 所 产生 的 维护 成 本 为 Com , 维 
护 时 间 为 Lpm 。 

(7) Cs 代表 了 备件 成 本 , 当 所 采取 的 维护 策略 发 生变 化 时 ,相对 应 的 备件 成 
本 Ci 也 会 发 生变 化 。 当 设备 向 较 差 的 健康 状态 转移 时 ,对 应 的 采取 维修 维护 动 
作 所 需要 的 备件 将 会 增加 ,因此 ,对 应 的 备件 成 本 也 变 得 越 高 。 

(8) 对 应 于 设备 健康 状态 i 和 设备 的 虚 龄 ,设备 的 故障 成 本 Cr 是 一 个 非 递减 
的 函数 。 在 不 同 的 设备 健康 状态 ,设备 的 故障 成 本 是 不 一 样 的 , 随 着 健康 状态 的 退 
化 和 设备 寿命 的 增加 ,设备 的 故障 成 本 也 随 之 提高 。 

对 于 维护 模型 ,本章 中 将 用 到 以 下 符号 或 标记 : 






































符号 描述 
Cs, 系统 成 本 
Cu 系统 维护 成 本 
CF 系统 故障 成 本 
Cr 故障 独立 成 本 
C 故障 依赖 成 本 
Cas 资源 成 本 
Cho 备件 成 本 
C, 维护 人 员 成 本 
Corder 备件 订货 成 本 
G 备件 存储 成 本 
[e 备件 缺 货 成 本 
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续 表 
符号 描述 
CA 设备 停机 成 本 
Citem 每 单位 备件 的 可 变 成 本 
ch 每 单位 备件 的 储存 成 本 
b, 第 个 维护 阶段 的 订货 数量 
K 每 次 订货 的 固定 成 本 
s 第 个 维护 阶段 的 初始 库存 水 平 
y 总 的 维修 人 员 数 量 
cp 缺少 维修 人 员 时 的 惩罚 系数 
E 设备 的 维护 阶段 数 
Chi 当 设 备 健康 状态 为 i 时 的 故障 独立 成 本 
colista) 在 时 间 设备 健康 状态 为 i 时 的 故障 依赖 成 本 
Py (te) 当 设备 虚 龄 为 ,时 ,从 健康 状态 j 转移 到 健康 状态 i 的 概率 
Cosi 当 设 备 健康 状态 为 i 时 的 维护 独立 成 本 
cu Ca, li) 当 设 备 健康 状态 为 i 时 ,采取 维护 动作 a, 产生 的 维护 依赖 成 本 
rlan |i) 当 设备 健康 状态 为 了 时 ,采取 维护 动作 ww 产生 的 备件 需求 数量 
pCa, |i) 当 设 备 健康 状态 为 i 时 ,采取 维护 动作 an PAE AE PAA te OR Bt 
Crln,F 一 ns,t,wvali) | 采取 维护 动作 a, 未 来 F 一 n 维护 阶段 的 期 望 总 成 本 
CGiF—n.t«a|)D | 采取 维护 动作 a, 未 来 Ff 一 n 维护 阶段 的 期 望 总 系统 成 本 和 资源 成 本 
TCF 一 na |i) | 采取 维护 动作 a, 未 来 下 一 n 维护 阶段 的 期 望 总 维护 时 间 
Cav (Yas an On |i) 当 设 备 健康 状态 为 i 时 ,第 个 维护 阶段 的 资源 成 本 
b 衰退 形状 因子 ( 即 设备 状态 转移 概率 形状 因子 ) 
d 停机 因子 ( 即 停机 成 本 系数 ) 
r 维护 风险 因子 ( 即 维护 风险 ) 


5.4.2 维护 成 本 分 析 


对 于 本 章 的 维护 模型 ,应 考虑 两 个 重要 的 需要 优化 的 维护 目标 :维护 总 成 本 
Ceu 和 设备 利用 率 Avx。 对 于 设备 的 维护 ,需要 平衡 设备 的 维护 成 本 和 设备 利用 率 
之 间 的 关系 ,根据 两 者 的 优化 目标 ,对 设备 执行 最 优 的 维护 策略 。 

设备 采取 的 维护 动作 对 企业 的 经 济 效益 会 产生 重要 的 影响 ,在 设备 的 维护 建 
模 中 ,维护 成 本 Cu 操作 成 本 C, 和 维护 资源 成 本 Cw 被 考虑 。 而 且 ,维护 成 本 Cu 
包括 置换 成 本 Ce 和 非 置 换 成 本 Cpw 两 大 类 。 设 备 的 成 本 是 直接 与 设备 所 采取 的 
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维护 动作 相关 联 的 ,包括 置换 成 本 (PMR ) .日 常 维护 成 本 (PMs ) 维修 维护 成 本 
(PM, ) ,以 上 这 些 成 本 ,统称 为 设备 的 维护 成 本 (Cw)。 与 设备 所 采取 的 维护 动作 
间接 相关 的 成 本 包括 设备 故障 成 本 (Cr ) 和 设备 的 资源 成 本 (Ca )。 通 过 采取 不 同 
的 维护 动作 ,设备 可 以 减缓 它 的 退化 与 老化 ,因此 ,设备 衰退 所 引起 的 设备 故障 成 
本 将 减少 ,这 就 说 明了 设备 的 故障 成 本 也 是 与 设备 的 维护 相关 联 的 ,是 设备 长 期 平 
均 总 成 本 的 一 部 分 。 另 一 方面 ,为 了 有 效 地 执行 设备 的 维护 动作 ,也 需要 不 同 的 维 
护 资源 。 对 应 各 种 不 同 的 维护 策略 ,需要 利用 不 同 的 资源 ,因而 ,产生 不 同 的 资源 
成 本 。 因 此 ,在 设备 长 期 的 平均 总 成 本 中 ,资源 成 本 也 被 作为 维护 模型 的 一 部 分 。 
设备 的 故障 成 本 是 与 设备 的 健康 状态 相关 联 的 ,而 设备 的 资源 成 本 是 与 所 采取 的 
维护 动作 相关 联 的 。 
因此 ,对 于 设备 的 总 成 本 目标 ,包括 系统 成 本 Cs (包括 设备 的 维护 成 本 Cm 
和 设备 的 故障 成 本 Cr) 和 设备 的 资源 成 本 Cs,。 同 时 ,在 考虑 设备 利用 率 的 基础 
上 ,设备 的 维护 动作 所 引起 的 停机 产生 的 停机 成 本 CA 也 包含 在 设备 的 维护 成 
本 模型 中 ,停机 成 本 CA 是 与 设备 的 维护 动作 持续 时 间 Tw 和 设备 停机 成 本 系数 
d 相关 的 ,因此 ,综合 考虑 设备 成 本 和 设备 利用 率 的 总 的 维护 模型 成 本 目标 可 以 
表示 为 
MinCrow = Cs, 十 Cw 十 CA=Cw 十 Cr 十 Cu 十 TwXd (5-7) 
l. 维护 模型 的 系统 成 本 
目前 ,在 工业 中 ,所 关注 的 问题 包括 降低 设备 的 操作 支持 成 本 和 提高 设备 的 安 
全 性 。 设 备 的 维护 直接 影响 设备 的 利用 率 和 企业 的 生产 效率 。 对 设备 维护 来 说 ， 
这 方面 的 直接 成 本 被 定义 为 系统 成 本 , 它 包括 设备 的 故障 成 本 和 设备 的 维护 成 本 
两 个 方面 。 因 为 设备 的 故障 成 本 可 能 会 涉及 设备 故障 的 识别 ,在 发 生 故障 的 时 刻 ， 
设备 的 备件 数量 不 足 , 也 可 能 由 于 设备 故障 发 生 的 无 计划 性 ,导致 缺少 设备 的 维护 
人 员 , 因 此 ,设备 的 故障 成 本 可 能 会 高 于 设备 的 维护 成 本 。 然 而 ,如 果 执 行 了 大 量 
的 维护 动作 ,也 将 导致 设备 维护 成 本 的 增加 。 因 此 ,设备 的 系统 成 本 是 设备 的 故障 
成 本 和 设备 的 维护 成 本 之 和 。 设 备 系 统 成 本 模型 可 以 表示 为 
Cs 一 Cr 十 Cw (5-8) 
设备 的 故障 成 本 是 由 两 部 分 组 成 ,分 别 是 设备 的 故障 独立 成 本 (Cr) 和 设备 的 
故障 依赖 成 本 ( 即 操作 成 本 C,) 。 设 备 的 故障 独立 成 本 描述 了 不 同 故障 所 产生 的 
固定 成 本 ,如 设备 冷却 .诊断 、 拆 印 、 重 新 组 装 、 启 动 和 加 热 所 产生 的 成 本 。 设 备 的 
故障 依赖 成 本 是 指 对 发 生 故障 零 部 件 的 维修 或 者 置换 操作 成 本 。 因 此 ,设备 的 故 
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障 成 本 模型 可 以 表示 为 
Cr = Cy C, = cgi + >) Pg G6 Cista) (5-9) 
j=l 


其 中 ,cj,; 表 示 当 设备 健康 状态 为 i 时 的 设备 的 故障 独立 成 本 ;cs Ci ty AR BRIE HH ME 
于 健康 状态 i 时 ,采取 维护 动作 a, 所 产生 的 设备 故障 依赖 成 本 ;Pi CO RR T E 
虚 龄 是 4 时 ,从 状态 j 到 状态 i 的 状态 转移 概率 。 

与 设备 的 故障 成 本 相似 ,设备 的 维护 成 本 也 是 由 两 部 分 组 成 ,分 别 是 设备 的 维 
护 独立 成 本 和 设备 的 维护 依赖 成 本 。 设 备 的 维护 独立 成 本 描述 了 采取 不 同 的 维护 
动作 所 产生 的 固定 成 本 ,如 设备 的 停机 、 降 温 、. 拆 印 .重新 组 装 .启动 和 加 热 所 产生 
的 成 本 。 设 备 的 维护 依赖 成 本 是 指 实 际 采取 的 设备 维护 动作 所 产生 的 成 本 。 因 
此 ,设备 的 维护 成 本 模型 可 以 表示 为 

Cu = cm (An) + eu Ca, | i) (5-10) 

其 中 ,c,; 表 示 当 设备 健康 状态 为 i 时 的 设备 的 维护 独立 成 本 ;对 于 6 (a,) 的 取 值 ， 
如 果 采 取 维 护 动作 an W O (a,) 的 取 值 为 1, 否 则 为 0;cm Ca, 1 站 代表 了 设备 处 于 健 
康 状态 i 时 ,采取 维护 动作 a 所 产生 的 设备 维护 依赖 成 本 。 

基于 方程 (5-8) 一 方程 (5-10) ,总 的 设备 维护 模型 的 系统 成 本 可 以 表示 为 





Cs, = Cu Ce = cmi tem Can | D Hei Pg eG) (5-11) 


2. 维护 模型 的 资源 成 本 
在 执行 设备 的 维护 策略 过 程 中 ,所 需要 的 资源 主要 包括 采取 维护 动作 所 需要 
的 设备 备件 和 设备 的 维护 维修 人 员 两 部 分 。 如 果 设 备 的 备件 和 设备 的 维护 维修 人 
员 满足 维护 动作 需求 , 则 设备 的 维护 策略 才能 有 效 地 执行 。 在 缺少 设备 维护 资源 
的 情况 下 ,设备 的 维护 动作 不 能 被 有 效 地 执行 ,从 而 ,会 产生 更 多 的 设备 的 停机 成 
本 。 因 此 ,将 设备 的 资源 信息 集成 到 设备 的 维护 模型 中 是 非常 重要 的 。 设 备 的 资 
源 成 本 主要 是 由 设备 的 备件 成 本 和 设备 的 维护 维修 人 员 成 本 所 组 成 的 ,因此 ,总 的 
设备 维护 模型 的 资源 成 本 可 以 表示 为 
Cay =Ciny + Cp (5-12) 
YER IS A UE AS SE BE FB ETT VELA (Cua 、 备 件 的 储存 成 本 (Ci ) 和 备件 
的 缺 货 成 本 (C,)。 因 此 ,设备 的 备件 成 本 模型 可 以 表示 为 
Cro = Corder + Cy + C, (5-13) 
设备 备件 的 订货 成 本 包含 固定 备件 订货 成 本 和 可 变 备 件 订货 成 本 ,因此 ,备件 
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的 订货 成 本 模型 可 以 表示 为 
Corder = KÒ (by) + Cie X On (5-14) 
其 中 , 6 (6b, ) 的 取 值 依赖 于 5, 的 值 是 否 为 0, 如 果 o, SEF 0.90] 0 Cb, A EL 1. 
WI. 6 (5,) 的 取 值 为 0;K 是 每 次 备件 订货 时 的 固定 订货 成 本 ,因此 ,K6(6,) 用 来 表 
示 备 件 总 的 固定 订货 成 本 ;ciwenm 表 示 每 单位 备件 的 可 变 订 货 成 本 ,b, 表 示 在 第 n 个 
维护 阶段 的 订货 数量 ,因此 ,ca Xb 表示 在 第 n 个 维护 阶段 总 的 备件 订货 可 变 
成 本 。 
设备 备件 的 储存 成 本 是 与 备件 的 库存 水 平 及 备件 的 需求 数量 相关 的 ,因此 , 设 
备 的 备件 储存 成 本 模型 可 以 表示 为 
C, = max{0.c,Ly, +6, — ra, | 01) 
n = yar + Opa — ray) 
其 中 ,表示 第 2 个 维护 阶段 的 初始 备件 库存 水 平 ;r(Cav|z) 描 述 了 当 设 备 健康 状态 
为 i 时 ,通过 采取 维护 动作 ww 所 产生 的 设备 备件 的 需求 数量 :c 表示 每 单位 设备 备 
件 的 储存 成 本 。 
设备 备件 的 缺 货 会 影响 设备 维护 动作 的 有 效 执行 ,进而 ,影响 设备 的 生产 使 
用 ,对 于 出 现 故 障 的 设备 部 件 , 由 于 设备 备件 的 缺少 ,不 能 及 时 得 到 有 效 的 维护 维 
修 。 因 此 ,为 了 避免 频繁 的 设备 备件 的 缺 货 , 设 备 备 件 的 缺 货 成 本 也 作为 设备 维护 
成 本 模型 的 一 部 分 。c, 表 示 每 单位 的 备件 缺 货 成 本 ,因此 ,设备 备件 缺 货 成 本 模型 
可 以 表示 为 


(5-15) 


C, = MP, Gmaxl0.c[r(a, | D — y, — ba ]} (5-16) 


MEF Ty HE (5-13) ~ Jr BE G-16) ,总 的 设备 维护 模型 的 备件 成 本 模型 可 以 表示 为 


Cy, = KÒ (bn) + Crem X b, + max{O,caL yn +b, — rlan | iJ} 十 ee 


SD PG maxl(0.c[r(a, | D — yn —5,]) 


在 维护 资源 成 本 模型 中 ,如 果 执 行 维护 动作 所 需要 的 人 力 资源 不 能 满足 需求 ， 
就 应 定义 维护 人 员 的 缺少 所 对 应 的 每 个 设备 健康 状态 的 惩罚 成 本 。 人 力 惩 罚 成 本 
是 与 在 执行 维护 动作 时 所 需要 的 人 力 数 量 及 缺少 维护 人 员 时 的 惩罚 系数 相关 联 
的 。 在 维护 人 员 成 本 模型 中 , 令 o RREN RKG y 表示 总 的 维护 人 员 的 数量 ,p 
Can 1 让 表示 当 设 备 处 于 健康 状态 i 时 ,通过 采取 维护 动作 a, 所 产生 的 维护 人 员 需 求 
数量 。 因 此 ,总 的 设备 维护 模型 的 维护 人 员 成 本 模型 可 以 表示 为 
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C, = >) Ps; (tn) max{0+c,[ plan | D — y]) (5-18) 
j=l 


基于 方程 (5-12) 方程 (5-17) 和 方程 (5-18) ,总 的 设备 维护 模型 的 资源 成 本 模 
型 表示 为 
Cav = Cw T6, 


= K8(b,) + cies X b, + max(0 c Lys +b. — rlan | )0]) + 
i (5-19) 
SP, GO [maxl0.c, Ga, | D — ya — ba)? F 


gat 


max(0.c,[5G, | i) — »])] 
5.4.3. 基于 动态 规划 算法 维护 策略 优化 模型 


在 本 章 内 容 中 ,集成 动态 维护 模型 的 阶段 ,对 于 未 来 无 穷 的 周期 ,如 果 考 虑 
最 优 的 设备 维护 策略 是 没有 多 大 意义 的 ,在 设备 的 使 用 过 程 中 ,时 间 越 长 ,周期 
越 多 ,设备 的 不 确定 性 就 会 越 大 ,从 而 ,设备 健康 预测 的 精度 就 会 降低 。 对 于 集 
成 的 动态 维护 模型 ,对 设备 的 整个 维护 建 模 过 程 的 划分 代表 了 维护 模型 的 维护 
周期 阶段 。 为 了 按时 间 的 先后 顺序 进行 集成 动态 维护 建 模 和 求解 最 优 的 维护 策 
略 , 需 要 根据 实际 的 时 间 顺 序 划 分 模型 的 维护 阶段 。 由 于 在 两 个 监测 时 刻 点 之 
间 , 具 有 固定 的 时 间 长 度 , 因 此 ,对 于 每 一 段 的 时 间 间 隔 , 被 认为 是 一 个 维护 阶 
段 。 因 此 ,本 童 中 定义 常数 下 二 {1,2,… ,Fmx)( Fwmax 表 示 模 型 维护 阶段 的 最 大 
值 ) 来 表示 设备 维护 模型 的 维护 阶段 ,因此 ,集成 动态 维护 模型 的 意义 就 在 于 求 
解 在 未 来 下 个 维护 阶段 内 的 最 优 设备 维护 策略 。 通 过 对 设备 维护 阶段 的 划分 ， 
设备 的 维护 问题 转化 为 阶段 决策 问题 ,在 每 个 阶段 的 每 个 设备 监测 时 刻 , 对 设备 
进行 维护 决策 和 采取 相应 的 维护 动作 ,采取 的 维护 动作 要 使 维护 目标 最 优化 ,以 
保证 在 每 个 阶段 的 维护 策略 都 是 最 优 的 。 总 的 设备 维护 最 优 策略 就 是 每 个 阶段 
最 优 策略 的 集合 。 

在 设备 的 每 个 维护 阶段 的 初始 时 刻 , 本 章 提出 的 维护 模型 的 健康 状态 代表 
设备 的 一 个 自然 健康 状况 。 对 于 设备 的 健康 状态 ,主要 表明 了 设备 的 演化 过 程 
的 特征 ,而且 ,在 给 定 某 个 设备 维护 阶段 的 健康 状态 时 ,该 维护 阶段 的 设备 健康 
状态 的 变化 与 以 前 的 维护 阶段 的 设备 健康 状态 的 演化 是 不 相关 的 。 另 外 ,在 维 
护 模型 建立 过 程 中 ,状态 是 可 以 直接 或 者 间接 进行 观测 的 。 集 成 动态 维护 模型 
建 模 过 程 中 ,所 涉及 的 状态 hp = (1.2.7 Lo ,通过 第 3 章 和 第 4 章 的 健康 预测 
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模型 获得 。 

对 于 集成 动态 维护 模型 的 决策 , 当 获 得 了 某 个 维护 阶段 的 设备 健康 状态 以 后 ， 

对 于 该 维护 阶段 ,应 根据 设备 的 健康 状态 执行 不 同 的 维护 动作 ,在 执行 维护 动作 

后 ,设备 将 转移 到 下 个 维护 阶段 的 某 个 健康 状态 ,这 就 是 设备 的 维护 决策 过 程 。 用 
决策 变量 来 描述 维护 决策 ,对 于 设备 维护 决策 的 集合 则 表示 了 决策 变量 的 可 取 值 
范围 。 基 于 方程 (5-5) ,最 优 决策 是 选择 最 优 的 维护 动作 ,因此 ,可 供 选 择 的 维护 动 
ERE: 

PMio 表 示 设 备 无 维护 ,维护 模型 不 受 影响 ; 

PM; 表 示 在 设备 进行 保养 维护 后 ,设备 不 发 生 状 态 之 间 的 转移 ,设备 的 状态 仍 
然 停留 在 当前 状态 ,同时 ,设备 的 虚 龄 降低 为 

2 to 十 EL 一 2) to) 十 0.5] 

PM, 表示 在 设备 进行 大 修 维护 后 ,设备 将 从 当前 的 健康 状态 恢复 到 一 个 更 好 
的 健康 状态 ,同时 ,设备 的 虚 龄 降低 为 : 

3 css ate TEAG Dirige) 0.5] 

PMa, 表示 在 设备 进行 置换 维护 后 ,设备 的 健康 状态 将 恢复 到 设备 的 初始 状态 
局 ,同时 ,设备 的 虚 龄 成 为 0。 

在 上 述 维护 动作 中 ,在 健康 状态 & 下 ,tc 代表 了 其 驻 留 时 间 。 通 过 方程 (5- 
1) 和 方程 (5-2) 可 以 获得 每 个 设备 健康 状态 的 驻 留 时 间 (kw )。E[zj] 是 下 取 整 函 
Bl. E[x 十 0.5] 是 对 x 执行 四 舍 五 人 的 取 整 操作 。4 代表 了 设备 的 维护 执行 效用 
函数 (Xe[0,1])。4 二 0, 执行 维护 动作 后 ,完成 修复 设备 ; 4 二 1, 表 示 对 设备 采取 
维护 动作 后 ,维护 动作 没有 任何 效用 ,在 当前 健康 状态 下 ,设备 的 虚 龄 将 保持 
不 变 。 

对 于 集成 动态 维护 模型 的 最 优 值 的 函数 , 它 是 衡量 设备 维护 过 程 优 劣 的 一 个 
数量 指标 。 在 执行 设备 的 第 次 检测 时 ,设备 处 于 健康 状态 i, 且 设备 虚 龄 是 4 , 因 
此 ,设备 在 下 个 维护 阶段 的 最 优 值 函 数 可 以 表示 为 

Min Cr(n.F—n.t,+ a |D —CG.F—n.t,.a|Dd- TF—n,t,ali Xd (5-20) 
其 中 ,a 是 在 第 个 维护 阶段 ,对 设备 所 采取 的 维护 动作 。, 是 第 n 个 维护 阶段 设 
备 的 虚 龄 。 在 维护 动作 a 对 应 的 未 来 下 一 n 个 期 间 内 ,Cr(n, 下 一 n,1, a |) RAR 
望 总 成 本 ,T(n,F 一 n,t, ,a | 让 表示 期 望 总 维护 时 间 。C(n,F 一 n,t,，a |i) ee 
动作 a 对 应 的 未 来 下 一 n 个 期 间 内 的 包括 系统 成 本 和 资源 成 本 的 期 望 总 成 本 。 
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提出 模型 的 设备 各 状态 之 间 的 相互 转化 关系 , 见 第 2 章 和 第 3 章 的 内 容 。 
对 应 下 个 维护 阶段 , 令 Ca Ons an ,bs| 丫 表示 当 设 备 的 健康 状态 为 i 时 ,第 
n 个 维护 阶段 的 资源 成 本 。 则 在 个 维护 阶段 以 后 ,期 望 总 资源 成 本 可 以 表 
示 为 
Cap G,F — n, Ynsân sba | D 
= C (Yn ran sba LOAD) oraa, Pa lw) (Cw nt Ly yet F—n— basa sben | 7) 
(5-21) 
基于 方程 (5-15) 和 方程 (5-21) ,可 得 维护 动作 a 对 应 的 未 来 下 一 个 维护 阶段 
内 期 望 资源 成 本 为 
Cw G,F —2,4,,5,| i) 
= Cy GF —n;a, b, | D + C, (Qi F — san 0, | D 
= KóG,) + cis X b, + maxt0 scr Cy, +b, — ra, | id} + T Pra a | 了 一 


ja 


Yn —5,)) + max(0.c, (plar | D— 2) J+ $34 ,Ps G0 (C, Cn +1, F —2— 1, 


Yn tb, — rlan | i) sany sbar | 7)" } (5-22) 
即 , 在 第 个 维护 时 刻 的 资源 总 成 本 由 两 部 分 组 成 :一 个 是 个 维护 阶段 内 的 
资源 成 本 ; 另 一 个 是 nn 十 1 时 刻 后 的 下 一 个 维护 阶段 的 期 望 总 资源 成 本 。 
针对 维护 动作 a ERK F— n 个 维护 阶段 ,设备 的 期 望 总 成 本 可 以 表示 为 
Cio,F—n,t,,a | i) 
= Cula) + CpG sts) + Cas lisasta) + 
D uns Ps DIC LE n— 14, tia’ | 7) 
(5-23) 
基于 方程 (5-23) ,在 第 m 个 维护 时 刻 的 期 望 总 成 本 由 两 部 分 组 成 :一 个 是 个 
维护 阶段 内 的 故障 成 本 、 维 护 成 本 和 资源 成 本 之 和 : 另 一 个 是 nn 十 1 时 刻 后 的 所 有 
维护 阶段 的 期 望 总 故障 成 本 维护 成 本 和 资源 成 本 之 和 。 
针对 维护 动作 a, 在 未 来 下 一 n 个 维护 阶段 ,设备 的 期 望 总 维护 时 间 可 以 表 
示 为 
T(n F— nst.sa | i) 
= ta) D atten Pe te (T+ 1,F—n— lite toa’ | )* ) (5-24) 
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在 第 nn 个 维护 时 刻 的 期 望 总 维护 时 间 由 两 部 分 组 成 :一 个 是 n 阶段 内 维护 动 
作 所 需要 的 维护 时 间 ; 另 一 个 是 z 十 1 时 刻 后 的 所 有 维护 阶段 的 期 望 总 维护 时 间 。 
针对 不 同 的 维护 动作 ,设备 维护 模型 的 目标 函数 表示 为 
C(n,F—n,t,sa | i) = 
Crist) + Cy GF — n PM vy | D+ DY settee Pa {Ctl F—n—l, 
t, la! | 7) a — PM, 
Cy (PMi) + Ce Gs) + Cy (n, F — n, PM; sb, | D + SAC F— n, 


j=i 


t Fla! |j) 十 riCO F— nt +1,PMz | L)* a = PM, 


L 
Cu(PM;) + CpG «tC ) + Ca (n, F — n, PM; sb, | i) + Mea —nCo.F—n. 


Li 


t +l, |? +7°°C(,F—n,t* +1,PM, | L)* a = PM, 
Cu(PMp) + Ce 1,0) + Cy, nF —n,PMe ob, | D+ >), 


=the 


Pu 
{Cna+1,F—n—1,1,a’ | j)*} 
t= Dato FEA — Diaa atw) +0. 5) 


t= NUT HEA, 一 NET 4-0.5) 





b, = argmax(C4, (nF — n, Yna sân sba | D) a = PMR 
(5-25) 
T(n, F —n;t,,a |i) = 
Dna Pr Tt TF - n — 1. + la | 5") a — PM, 
L 
(PM + SrA =r) Ty F— nt 1a! 1j 
j=i 
rT (n,F—n,t +1,PMy | L)* a = PM; 
L 
PM + Meta —DTG.F—n4 ba |g? + 
4-j 
r‘T(n,F—n,t* +1,PMy | L)* a = PM, 
KPMg) + >) Lu Py (CTOLC 1,F — n — 1.042 | j)*)} a = PM, 
(5-26) 
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集成 动态 维护 模型 可 以 被 转换 为 一 个 双 层 优化 问题 。 在 给 定 维护 动作 a 的 情 
况 下 ,维护 模型 第 一 层 的 主要 目的 就 是 获得 最 优 的 备件 库存 策略 和 最 小 的 设备 资 
源 成 本 ,在 维护 模型 的 第 二 层 , 这 个 来 自 第 一 层 的 最 小 的 设备 资源 成 本 作为 集成 动 
态 维 护 模型 的 输入 值 ,从 而 可 以 获得 最 优 的 设备 维护 策略 。 对 于 这 个 集成 的 双 层 
动态 维护 模型 的 框架 如 图 5-5 所 示 。 


备件 订货 成 本 备件 储存 成 本 | | 备件 缺 货 成 本 | | 缺少 人 力 资源 
Code c 6 REC, 





最 小 的 资源 成 本 
影响 C, 
影响 
动作 ; 维护 成 本 
置换 PUE | 置换 成 本 
i PM,, C,APM,,) | | 时 间 独 


设备 寿命 和 状态 
更 新 设备 寿命 和 状 集成 动态 维护 


TORERE | 影响 [ NO 模型 总 成 本 
Pt) Cis) 


nae 最 小 优化 





























影响 更 新 设备 寿命 和 状态 
(退化 和 老化 ) | | (总 停机 时 间 ) 时 间 ta) 


5-5 ”集成 的 双 层 动态 维护 模型 框架 














5.4.4 维护 策略 优化 算法 


基于 方程 (5-25) 和 方程 (5-26) ,求解 提出 的 集成 动态 维护 模型 由 两 个 启发 式 算 
法 组 成 ,这 两 个 启发 式 算法 用 来 求解 维护 模型 的 最 优 维 护 策略 a On F— nt, 1D" o 在 
第 F—n—m 个 维护 阶段 , 当 设 备 的 虚 龄 为 好-。 ,和 设备 的 健康 为 i 时 ,“ 启 发 式 算 


-127- 


© 大 数据 驱动 的 设备 健康 预测 及 维护 决策 优化 


法 1” 被 用 来 求解 设备 资源 成 本 模型 ,获得 最 优 的 设备 资源 成 本 Ci, 。 基 于 “启发 式 
算法 1”, 第 个 维护 阶段 , 当 设 备 的 虚 龄 为 i, 和 设备 的 健康 为 i 时 ,“ 启 发 式 算法 2” 
被 用 来 求解 设备 的 维护 模型 ,获得 设备 最 优 的 维护 策略 集合 。 两 个 启发 式 算法 的 
详细 求解 步骤 如 下 。 

启发 式 算法 1 最 优 资源 成 本 策略 算法 

第 一 步 , 读 取 参 数值 K scitem ,ci ,cs ,co,;,F。 需 求 集合 rla, |i) (反映 了 在 不 同 状 
态 下 执行 各 种 维修 动作 所 需要 的 部 件数 量 )。 

第 二 步 ,初始 化 参数 q=0. 

第 三 步 , 计 算 第 F—n—q 个 维护 阶段 的 最 优 资源 成 本 。 

CD 获得 最 优 订货 数量 br-n o 

(2) 基于 方程 (5-25) ,计算 Cay (下 一 ggqyar o Dp, | D ,表示 为 Cu 。 

(3) 令 br-， ,一 pr- 十 1, 重 新 计算 CALCF 一 qqyaroypr | i) ,表示 
Ai C. 

(A) 比较 Cao FIC’ ao ,如 果 Cao C, + D) C sy = Cav o BEE CO WE Car C e 
S Ci — Ca, , 跳 至 (5) 。 

G) 如 果 qm. g==g 十 1, 跳 回 (1) ,和 否则 , 跳 至 第 四 步 。 

第 四 步 , 算 法 结束 (Ch 是 最 优 的 资源 成 本 )。 

启发 式 算法 2 最 优 维 护 策略 算法 

第 一 步 , 读 取 各 参数 值 Cr ,Cu ,i(PM) ,d ,下 ,及 设备 的 初始 状态 转移 概率 Ps. 
各 状态 驻 留 时 间 ko o 

第 二 步 , 在 第 个 维护 阶段 ,初始 化 参数 值 m=0. 

第 三 步 ,计算 第 FF 一 n 一 m 个 维护 阶段 的 最 优 维护 动作 集合 。 

(D Fortr-m €(1.2. 74,4 F—n—m) 

Fori €(1,2,---.L) 
Fora e{PM, .PM; , PM, ) U (PM; |1<j<i—1,j eH) 

基于 “启发 式 算法 1”, 计 算 最 优 设备 资源 成 本 Ch 

基于 方程 (5-25) ,计算 期 望 总 系统 和 资源 成 本 CCF — m «m «tg, sali) 

基于 方程 (5-26) ,计算 期 望 总 维护 时 间 TF m «m «tg, sali) 

基于 方程 (5-20) ,计算 期 望 总 成 本 Cz CF mn m «tg, sali) 
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a(F —m,m,tpm | i)” = argmin{C;(F — m,m ,tr-msa | i)} 

C(F—m,F—n—m,trmsa | i)* = C(F—m,F—n— m,tr-msa* | i) 

T (F—m,F—n—mytpmsa|i)* = TiF—m,F—n—mytpmsa* | i) 

A(F—m,m,tpm)” = [a(F—mymytpm | i)* i = 1,2, L] 

A(F—m,m)* = [aC(F — m,m | istpm)” si = 152505 L3tpim = 1,2,. ,1, + 

F—n—m] 

(2) 如 果 m-—F—n. $ m-—m--1.8EIPICD ,否则 , 跳 至 第 四 步 。 

第 四 步 ,根据 当前 的 健康 状态 i 及 虚 龄 ,选择 设备 的 最 优 维护 动作 
aln,F—n,t, | i)* 基于 最 优 策略 集合 A (n,F 一 n)*。 

在 上 述 算 法 中 ,a(F 一 m,m,tr_m |i)” 表示 设备 虚 龄 为 r-n 和 设备 的 健康 状态 
为 i 时 的 最 优 维护 策略 。 A( 下 一 m,m,te_，)” 描 述 了 设备 虚 龄 为 tr-w 时 ,所 有 设备 
健康 状态 的 最 优 维护 策略 。 ACE — mm)” RR FS Fn m 个 维护 阶段 的 最 优 
维护 策略 。 


5.5 算 例 分 析 


在 本 章 的 案例 分 析 中 ,我 们 仍 以 液压 泵 (设备 ) 为 研究 对 象 。 很 显然 ,该 液压 泵 
在 使 用 运行 过 程 中 , 随 着 使 用 时 间 的 增加 性 能 会 逐渐 衰退 ,设备 的 健康 状态 会 逐渐 
变 差 , 因 而 ,需要 对 设备 进行 相应 的 维护 使 其 维持 正常 的 工作 ,以 避免 设备 失效 带 
来 的 高 成 本 和 高 风险 。 并 且 , 随 着 使 用 运行 成 本 和 维护 成 本 的 不 断 增加 ,也 可 以 考 
虑 实施 置换 维护 。 因 此 ,集成 训 退 性 能 ,结合 诊断 信息 和 预测 信息 ,在 期 望 总 成 本 
和 期 望 总 维护 时 间 为 目标 的 基础 上 ,制定 集成 的 动态 维护 策略 。 本 算 例 数 据 分 析 
所 用 运行 平台 为 Matlab VC ,运行 环境 为 Windows XP。 采 用 液压 泵 总 计 42 组 数 
据 来 描述 轴承 的 全 寿命 过 程 。 


5.5.1 数据 准备 
根据 上 面 内 容 提出 的 集成 动态 维护 模型 ,在 使 用 过 程 中 ,为 了 制定 最 优 的 维护 
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策略 , 则 所 提出 的 集成 动态 维护 模型 的 输入 参数 主要 包括 不 同 健康 状态 下 的 故障 
成 本 .采取 各 类 维护 动作 产生 的 维护 成 本 、 健 康 状态 转移 概率 、 备 件 库存 成 本 HE 
人 员 成 本 等 成 本 。 

1. 状态 转移 概率 

液压 泵 健康 状态 间 的 转移 概率 矩阵 可 以 根据 第 3 章 和 第 4 章 的 内 容 获得 ， 
液压 泵 的 健康 状态 划分 成 四 个 健康 状态 Level 1 表示 正常 状态 ;Level 2 don E 
退 状 态 1; Level 3 表示 衰退 状态 2; Level 4 RMIRRKMKA. WHERE 
阵 为 


1-6 Qt &)Y 7, Pi P% A+B)" 
0 1—6 +f)! 57, ,P5 
un M K 
0 
0 K 
K K Por A+R)" 
K K PAHA 
K O M 
K 1-0 Qc BYPLus Phir A+R)’ 
K 0 Prr 


! 表示 设备 的 虚 龄 , Bodo E ETE TET E: —0. 180079, b 是 一 个 状态 转 
TEMERE AR AF O —1— 0,0501) 4 0 等 于 0 的 时 候 , 设 备 的 衰退 模式 为 递减 
模式 。 四 个 健康 状态 的 初始 转移 概率 如 表 5-1 所 示 。 不 同 健康 状态 的 驻 留 时 间 如 
K 5-2 BR, 


表 5-1 初始 状态 转移 概率 














健康 状态 Level 1 Level 2 Level 3 Level 4 
Level 1 0. 890 3 0.108 9 0. 000 6 0. 000 2 
Level 2 0 0. 719 4 0. 280 2 0. 000 4 
Level 3 0 0 0.981 6 0.018 4 
Level 4 0 0 0 1 
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表 5-2 ”各 个 健康 状态 的 期 望 驻 留 时 间 











健康 状态 Level 1 Level 2 Level 3 Level 4 

驻 留 均值 10. 635 1 9. 675 3 11.543 2 一 

驻 留 方差 1.929 1 1.058 1 1.284 1 一 
DO) 10. 700 9 9.713 3 11.585 8 — 





2. 维护 时 间 和 维护 成 本 
采取 不 同 维护 动作 所 产生 的 维护 成 本 和 维护 时 间 如 表 5-3 和 表 5-4 所 示 。 并 
且 , 设 备 的 维护 执行 效用 函数 4 =0. 6。 


表 5-3 维护 动作 成 本 













































































健康 状态 Cri cm(PMr) | cu(PMio) | c«( PM) | cu (PMis) | cu (PMis) 
Level 1 100 18 000 0 200 — — 
Level 2 130 18 000 0 500 250 — 
Level 3 160 18 000 0 700 650 400 
Level 4 190 18 000 0 
表 5-4 维护 动作 时 间 
健康 状态 t(PMe. ) t(PMio) 1(PMi1) t(PM:2) t(PM;;) 
Level 1 1 0 0.1 — — 
Level 2 1 0 0.5 0.15 一 
Level 3 1 0 0.8 0.4 0.3 
Level 4 1 0 = = = 
3. 设备 故障 成 本 
设备 的 故障 成 本 是 与 设备 的 健康 状态 及 设备 的 使 用 时 间 相 关联 的 。 因 此 , 设 
备 的 故障 独立 成 本 为 
150 i=1 
. $200 i2 
^^ 250 i=3 
300 i=4 


设备 的 故障 依赖 成 本 可 以 表示 为 
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1201 + 90¢ 


i 

0i 4- . 
5 80i 二 93t i 
了 

i 





70i + 95t 


4. 资源 成 本 

设备 的 备件 和 维护 人 员 的 需求 数量 是 由 设备 的 健康 状态 与 设备 所 采取 的 维护 
动作 决定 的 。 对 于 不 同 的 维护 动作 所 需要 的 设备 备件 和 维护 人 员 的 数量 如 表 5-5 
和 表 5-6 所 示 。 


表 5-5 设备 备件 需求 量 






































健康 状态 PMi, PM;r PM; PM; PM; 
Level 1 0 5 0 = < 
Level 2 0 5 1 0 = 
Level 3 0 5 3 $ 0 
Level 4 0 5 = — — 

表 5-6 设备 维护 人 员 需 求 量 

健康 状态 PMio PMig PM; PM; PM;; 
Level 1 0 3 0 = = 
Level 2 0 3 1 0 = 
Level 3 0 3 2 1 0 
Level 4 0 3 = = = 




















其 他 与 备件 库存 相关 或 者 不 相关 的 参数 如 下 : 

K —4 000 + Citem —500,c, —35,c, —1 200,c,=1 300, y—2, F—12, T—32 

5. 维护 动作 风险 

在 本 章 中 ,我 们 用 维护 风险 因子 ~ 描述 设备 的 维护 动作 风险 。 随 着 7 的 增 大 ， 
设备 的 维护 动作 风险 也 随 之 增 大 。 因 此 ,在 案例 中 ,考虑 了 两 种 维护 风险 , 即 维护 
风险 小 和 维护 风险 大 。 

当 维护 风险 小 时 ,维护 风险 因子 -可 以 表示 为 











0. 05 1<t<20 
r(t) = (0.05 + 0. 02(¢ — 20) 20 xt « 45 
0.5 45 xt 


当 维 护 风 险 大 时 ,维护 风险 因子 r 可 以 表示 为 


一 132 一 
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0.2 Izr« 20 
r(t) = (0. 24-0. 03€ — 20) 20 xt « 45 
0.6 45 «t 


5.5.2. 其 他 维护 策略 


目前 ,企业 经 常 使 用 定期 维护 来 维护 设备 的 健康 状态 或 者 操作 状态 ,因此 ,定期 
维护 是 一 种 常用 的 维护 方式 。 定 期 维护 主要 包括 定期 维护 监测 和 定期 维修 。 它 的 目 
的 就 是 在 设备 的 生命 周期 内 获得 最 优 的 维护 策略 ,对 于 每 个 维护 阶段 ,在 两 次 维护 动 
作 之 间 都 有 一 个 时 间 间 隔 工 ,每 个 时 间 间 隔 可 以 确定 所 采取 的 最 优 维护 策略 。 

基于 设备 的 健康 状态 , 当 设 备 的 健康 状态 停留 在 健康 状态 Level 1 时 ,保养 性 
维护 动作 被 执行 ,这 将 保持 设备 尽 可 能 地 停留 在 当前 的 健康 状态 。 当 设备 的 健康 
状态 停留 在 健康 状态 Level 2 或 者 Level 3 时 ,执行 维修 维护 动作 ,这 将 使 设备 从 健 
康 状 态 Level 2 或 者 Level 3 恢复 到 一 个 更 好 的 健康 状态 。 当 设备 的 健康 状态 停留 
在 健康 状态 Level 4 时 ,执行 置换 维护 动作 ,这 将 使 设备 从 健康 状态 Level 4 恢复 到 














一 个 更 好 的 健康 状态 。 设 定 的 定期 维护 策略 如 表 5-7 所 示 。 
表 5-7 定期 维护 策略 

0<t<20 20-135 35<t<45 45<t 
健康 状态 每 10 期 维护 一 次 | 每 7 期 维护 一 次 每 5 期 维护 一 次 | 每 3 期 维护 一 次 

(T=10) (T=7) (T=5) (T=3) 
Level 1 PM, PM PM PM 
Level 2 PM; PM; PM; PM;; 
Level 3 PMs: PM; PM; PM; 
Level 4 PMir PMirk PMirk PMikł 














为 了 模拟 不 同 的 维护 情境 ,选择 了 三 个 主要 变动 参数 :衰退 因子 5b、 停 机 因子 d 
及 维护 风险 因子 ~。 每 个 参数 选 两 个 值 ,并 且 对 这 三 个 参数 进行 不 同 的 组 合 来 说 明 
提出 的 维护 模型 的 有 效 性 ,如 表 5-8 和 表 5-9 所 示 。 


表 5-8 三 个 参数 的 取 值 状态 








衰退 二 0( 弟 减 模式 ) bs 二 0.3( 钟 形 模 式 ) 
停机 d, —1 000( 停 机 损失 小 ) d; —5 000( 停 机 损失 大 ) 
维护 风险 mn( 维 护 风 险 小 ) ro (维护 风险 大 ) 
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表 5-9 三 个 参数 的 组 合 策略 
组 合 1 2 3 4 5 6 7 8 
衰退 bi bz bi bz bi bz bi bz 
停机 di di dz dz dı dı dz dz 
维护 风险 n n n n rz re rz re 








5.5.3 维护 结果 分 析 


对 于 集成 动态 维护 策略 及 定期 维护 策略 ,分 别 执行 10 次 仿真 ,针对 每 次 仿真 ， 
每 种 维护 策略 都 包括 600 个 检测 周期 ,根据 10 次 仿真 的 平均 值 来 计算 仿真 评价 指 
标 。 单 位 平均 成 本 c, 设 备 平均 寿命 上 被 用 作 仿真 评价 指标 ,两 种 策略 的 仿真 结果 


如 表 5-10 所 示 。 


从 表 5-10 的 8 种 组 合 策略 可 以 看 出 ,在 单位 时 间 成 本 降低 的 方面 ,集成 的 动 
态 维护 策略 都 具有 良好 的 表现 ,具有 比 定期 维护 策略 更 好 的 性 能 。 对 于 集成 的 动 
态 维护 的 所 有 组 合 策略 ,组 合 策略 1 是 最 好 的 ,由 于 集成 的 动态 维护 策略 积极 的 维 
护 动作 ,设备 处 于 较 好 状态 的 持续 工作 时 间 要 长 于 定期 维护 策略 。 因 此 ,采取 集成 




















的 动态 维护 策略 的 设备 平均 寿命 周期 要 长 于 定期 维护 策略 。 
表 5-10 两 种 维护 策略 的 不 同 组 合 策略 的 仿真 结果 比较 




















组 合 策略 组 合 1 组 合 2 
c 1 351. 87 1 751. 49 1 522. 37 1 938. 31 
t 64. 38 52.19 52. 87 44. 62 
成 本 降低 399. 62(22. 81%) 415. 94(21. 45%) 
寿命 延长 12. 19(23. 35%) 8. 25(18. 48) 
组 合 策略 组 合 3 组 合 4 
c 1 765. 43 2 191. 07 1 923. 73 2 262.7 
t 60. 26 51.79 53. 52 45. 87 
成 本 降低 425. 64(19. 42%) 338. 97(14. 98%) 
寿命 延长 8. 47(16. 35%) 7. 65(16. 67%) 
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续 表 
组 合 策略 组 合 5 组 合 6 
" 集成 动态 定期 维护 集成 动态 定期 维护 
odis 维护 策略 策略 维护 策略 策略 
c 1 503. 64 1 943. 95 1 603. 95 1 951. 78 
t 55.97 46. 36 50. 77 43. 57 
成 本 降低 440. 31(22. 65%) 347. 83(17. 82%) 
寿命 延长 9. 61(20. 72%) 7. 2(16. 5394) 
组 合 策略 组 合 7 组 合 8 
集成 动态 定期 维护 成 动态 定期 维护 
PN: 维护 策略 策略 iiid 策略 
c 1 889. 16 2 168. 97 1980. 41 2 277. 93 
t 58. 92 50. 53 48. 94 42. 76 
成 本 降低 279. 8112. 94) 297. 52(13. 06%) 
寿命 延长 8. 39(16. 61%) 6. 18(14. 45%) 


对 于 设备 总 体 集成 动态 维护 策略 ,如 表 5-11 所 示 , 通 过 采取 定期 设备 维护 
策略 延长 了 设备 的 寿命 ,但 是 ,设备 的 维护 占用 了 较 长 的 设备 工作 时 间 ,使 设备 
长 时 间 处 于 停机 状态 ,进而 损耗 了 高 昂 的 设备 维护 成 本 。 采 用 集成 动态 维护 策 
略 的 目标 不 仅仅 是 增加 设备 的 平均 寿命 ,而 且 可 以 基于 设备 的 健康 状态 ,选择 最 
优 的 维护 策略 ,进而 提高 设备 的 利用 率 , 延 长 设备 的 平均 寿命 ,降低 设备 维护 的 
单位 成 本 。 从 表 5-11 的 计算 数据 可 以 看 出 ,集成 动态 维护 策略 与 不 维护 相 比 
较 , 采 用 集成 动态 维护 策略 可 以 降低 设备 的 单位 维护 成 本 26. 9175 ,提高 设备 的 
利用 率 1. 39%。 与 定期 维护 相 比 较 , 采 用 集成 动态 维护 策略 降低 单位 维护 成 本 
17. 88% ,提高 设备 的 利用 率 5. 91%。 与 没有 考虑 资源 等 约束 条 件 的 纯 动态 维 
护 策略 相 比 较 , 采 用 集成 动态 维护 策略 可 以 降低 单位 维护 成 本 8. 6% ,提高 设备 





的 利用 率 3. 6% 。 


表 5-11 不 同 维护 策略 的 仿真 比较 结果 











评估 标准 集成 动态 维护 策略 纯 动态 维护 策略 定期 维护 不 维护 
c 1 692.57 1 851. 86 2 060. 78 2 318. 53 
t 55, 71 51. 69 47.21 32. 69 
Au(%) 98. 85 95. 29 91. 28 95. 42 
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图 5-6 描述 了 定期 维护 在 某 一 次 全 寿命 过 程 中 采取 的 维护 动作 。 其 中 ,z 坐标 
代表 了 设备 的 寿命 ,y 坐标 代表 执行 的 维护 动作 ,0 表示 PM ,1 表示 PMi ,2 表示 
PM; ,3 表示 PMzs ,4 表示 PMa ,5 表示 PMss ,6 表示 PMss ,7 表示 PMR 。 根 据 
图 5-6, 在 定期 维护 的 情形 下 , 当 健康 状况 转移 到 Level 6 时 ,设备 的 寿命 为 45 ,这 
种 情况 下 ,仍然 对 设备 执行 了 大 量 的 维护 动作 ,提高 了 设备 的 运转 时 间 , 增 加 了 设 
备 的 寿命 。 然 而 ,采取 这 些 维护 动作 花费 了 大 量 的 维护 时 间 及 费用 。 

















0 10 20 30 40 50 60 
寿命 周期 1 
图 5-6 设备 全 寿命 周期 的 定期 维护 策略 

图 5-7 描述 了 集成 动态 维护 在 某 一 次 全 生命 过 程 中 采取 的 维护 动作 。 从 图 

5-7 中 可 以 看 出 ,在 设备 的 初始 工作 状态 ,集成 动态 维护 策略 执行 了 大 量 的 保养 
维护 和 维修 维护 ,在 这 种 情况 下 ,设备 可 以 较 长 时 间 地 维持 在 比较 好 的 设备 健康 
状态 ,从 而 减少 设备 的 故障 成 本 。 在 设备 持续 工作 过 程 中 ,在 设备 转移 到 健康 状 
态 Level 3 后 ,即使 对 设备 采取 维护 动作 PMsi ,使 设备 从 健康 状态 Level 3 恢复 到 
健康 状态 Level 1 ,设备 在 后 续 的 运转 过 程 ,也 很 快 会 转移 到 健康 状态 Level 3。 
从 图 5-7 中 的 曲线 可 以 看 出 , 当 设 备 进入 健康 状态 Level 3 后 ,对 设备 来 说 ,并 没 
执行 大 量 的 维护 动作 ,置换 维护 动作 被 执行 ,设备 就 可 以 恢复 到 一 个 较 好 的 健康 
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5-7 ”设备 全 寿命 周期 的 集成 动态 维护 策略 


5.5.4 ”备件 库存 策略 分 析 


在 这 一 部 分 ,将 对 设备 全 寿命 周期 的 集成 动态 维护 策略 和 备件 库存 水 平 之 间 
的 关系 进行 分 析 , 图 5-8 显示 了 设备 在 集成 动态 维护 策略 和 备件 库存 水 平 之 间 的 
KZ. ME 5-8 中 可 以 看 出 ,由 于 高 昂 的 备件 订货 费用 , 当 设备 进入 健康 状态 Level 2 
时 ,为 了 使 设备 的 健康 状态 从 Level 2 恢复 到 Level 1, 最 优 的 集成 动态 维护 没有 选 
择 执行 PMa 。 随 着 运转 时 间 的 增长 ,设备 的 故障 成 本 会 相应 地 提高 ,在 这 种 情况 
下 ,将 设备 备件 的 订货 费用 ,在 后 续 的 设备 备件 需求 过 程 中 ,逐次 进行 分 推 。 执行 
维护 动作 PMa 和 PMs, ,确定 订货 决策 。 

当 固定 订货 费用 等 于 0 时 ( 即 K=0) EL 5-9 表示 了 最 优 集成 动态 维护 的 变 
化 趋势 。 如 果 没 有 固定 的 备件 订货 费用 ,最 优 的 备件 库存 策略 就 是 按 需 求 订货 ， 
没有 备件 的 库存 ,但 是 ,相对 应 的 最 优 维护 策略 会 发 生 改 变 。 设 备 状态 转移 到 
Level 2 ,需要 立即 执行 PM2 ,从 而 确保 设备 长 时 间 地 保持 正常 工作 。 并 且 , 最 优 
集成 动态 维护 策略 在 不 同 的 备件 库存 参数 下 ,会 发 生 相 对 应 的 变化 。 如 果 说 在 
集成 动态 维护 策略 模型 中 ,没有 集成 备件 的 信息 ,设备 的 维护 不 受 备件 订货 、 库 
存 及 缺 货 的 影响 ,但 是 ,在 获得 最 优 的 设备 维护 策略 的 同时 ,造成 了 极 高 的 设备 
备件 费用 。 


一 37 一 


大 数据 驱动 的 设备 健康 预测 及 维护 决策 优化 








一 一 维护 动作 
一 一 备件 库存 水 








Ñ 








维护 动作 











0 ex- er 5 o a dei era 
0 10 20 30 40 50 60 
寿命 周期 


图 5-8 集成 动态 维护 策略 与 备件 库存 水 平 之 间 的 关系 
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5-9 ”固定 订货 费用 对 最 优 维护 策略 的 影响 


5.5.5 策略 动态 性 分 析 


在 制定 集成 动态 维护 策略 过 程 中 ,有 三 个 参数 对 集成 动态 维护 策略 的 制定 有 
影响 ,分 别 是 转移 概率 形状 因子 .停机 因子 d 和 维护 风险 因子 -~。 

1. 设备 衰退 对 集成 动态 维护 策略 决策 的 影响 

对 组 合 策略 1 和 组 合 策略 2 来 说 ,具有 相同 的 停机 因子 和 维护 风险 因子 ,但 是 
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5-9 ”固定 订货 费用 对 最 优 维护 策略 的 影响 


5.5.5 策略 动态 性 分 析 


在 制定 集成 动态 维护 策略 过 程 中 ,有 三 个 参数 对 集成 动态 维护 策略 的 制定 有 
影响 ,分 别 是 转移 概率 形状 因子 .停机 因子 d 和 维护 风险 因子 -~。 

1. 设备 衰退 对 集成 动态 维护 策略 决策 的 影响 

对 组 合 策略 1 和 组 合 策略 2 来 说 ,具有 相同 的 停机 因子 和 维护 风险 因子 ,但 是 
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设备 的 衰退 模式 不 同 , 对 应 不 同 的 衰退 因子 5, 所 获得 的 集成 动态 维护 动作 决策 如 
图 5-10 所 示 。 
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图 5-10 ”衰退 因子 大 小 对 应 的 维护 动作 

随 着 衰退 因子 5b 的 增加 ,设备 的 衰退 模式 将 逐渐 从 递减 模式 向 钟 形 模式 转移 。 
在 递减 模式 下 ,设备 以 最 大 的 概率 停留 在 当前 的 健康 状态 ,在 钟 形 模式 下 ,设备 保 
持 在 当前 健康 状态 的 概率 变 小 ,设备 更 加 倾向 于 向 较 差 的 状态 转移 。 因 此 ,置换 维 
护 动作 将 被 执行 ,降低 设备 的 老化 速度 。 对 应 不 同 的 衰退 模式 ,将 产生 不 同 的 维护 
策略 ,从 图 5-10 中 可 以 看 出 ,为 了 适应 不 同 的 衰退 模式 ,集成 动态 维护 策略 可 以 自 
动 进行 调整 ,以 保持 设备 的 正常 使 用 。 

2. 设备 停机 对 集成 动态 维护 策略 决策 的 影响 

对 组 合 策略 1 和 组 合 策略 3 来 说 ,具有 相同 的 衰退 趋势 和 维护 风险 因子 ,但 是 
设备 的 停机 损失 不 同 ,对 应 不 同 的 停机 因子 &, 所 获得 的 集成 动态 维护 动作 决策 如 
图 5-11 所 示 。 

根据 停机 因子 d 取 不 同 的 值 ,设备 具有 不 同 的 利用 率 和 停机 损失 。 与 其 他 维 
护 动 作 相 比较 ,置换 维护 动作 需要 一 个 比较 长 的 维护 时 间 , 在 这 种 情况 下 ,造成 很 
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图 5-11 停机 损失 因子 大 小 对 应 的 维护 动作 


大 的 设备 停机 损失 。 从 图 5-11 中 可 以 看 出 , 随 着 停机 因子 4 的 增加 ,为 了 降低 设 
备 置 换 维护 的 次 数 和 避免 设备 的 健康 状态 转移 到 更 差 的 状态 ,将 对 设备 采取 大 量 
的 保养 维护 和 维修 维护 动作 。 

3. 设备 维护 风险 对 集成 动态 维护 策略 决策 的 影响 

除了 不 维护 和 置换 维护 动作 ,其 他 的 维护 动作 在 执行 过 程 中 ,都 会 产生 一 定 程 
度 的 维护 风险 。 随 着 设备 维护 风险 的 增加 ,对 设备 实际 的 维护 效果 会 离 期 望 维护 
目标 越 来 越 远 。 对 组 合 策略 1 和 组 合 策略 5 来 说 ,具有 相同 的 衰退 趋势 和 停机 因 
子 , 但 是 设备 的 维护 风险 损失 不 同 ,对 应 不 同 的 维护 风险 因子 ~, 所 获得 的 集成 动态 
维护 动作 决策 如 图 5-12 所 示 。 

随 着 维护 风险 因子 r 的 增加 ,为 了 弥补 由 于 采取 维护 动作 所 产生 的 维护 风险 ， 
设备 需要 去 增 大 维护 动作 的 改善 幅度 , 即 转换 维护 动作 的 方式 。 从 图 5-12 中 可 以 
看 出 ,针对 不 同 的 维护 风险 ,集成 的 动态 维护 策略 能 调整 维护 动作 ,保持 设备 处 于 
较 好 的 健康 状态 。 
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5-12 维护 风险 因子 大 小 对 应 的 维护 动作 
基于 集成 动态 维护 策略 的 动态 分 析 , 我 们 可 以 看 出 ,针对 不 同 的 设备 衰退 模 
式 . 设 备 停机 因子 大 小 和 设备 的 风险 因子 的 大 小 ,集成 动态 维护 策略 具有 很 好 的 动 
态 性 。 并且, 集成 动态 维护 策略 可 以 根据 不 同 参数 的 变动 ,通过 计算 获得 相应 的 最 
优 维护 动作 和 最 优 的 维护 策略 。 


5.6 本 章 小 结 


根据 第 3 章 和 第 4 章 中 对 设备 的 在 线 健康 预测 研究 ,本 章 内 容 探讨 了 考虑 设 
备 退 化 和 老化 、 维 护 风 险 的 维护 问题 ,提出 了 集成 动态 维护 模型 。 首 先 ,对 多 传 感 
器 监测 的 数据 信息 进行 有 效 处 理 , 作 为 在 线 健康 预测 模型 的 输入 。 其 次 ,考虑 设备 
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的 老化 和 退化 ,将 设备 的 衰退 信息 集成 到 维护 模型 中 。 然 后 ,利用 在 线 健康 预测 模 
型 识别 设备 的 健康 状态 ,获得 健康 状态 间 的 转移 概率 ,计算 各 个 健康 状态 的 驻 留 时 
间 。 对 于 每 个 健康 状态 ,执行 不 同 的 维护 动作 来 优化 其 到 一 个 期 望 的 目标 。 最 后 ， 
提出 双 层 集成 动态 维护 模型 ,通过 分 析 不 同 的 维护 动作 ,描述 了 不 同 的 维护 动作 的 
影响 。 将 不 同 的 维护 动作 对 维修 人 员 和 备件 库存 的 需求 与 影响 作为 约束 条 件 , 集 
成 到 动态 维护 模型 中 。 集 成 动态 维护 模型 在 达到 最 小 化 维修 成 本 的 同时 ,还 可 以 
获得 最 优 的 资源 策略 和 最 低 的 资源 成 本 。 提 出 的 集成 动态 维护 模型 ,充分 考虑 了 
设备 的 诊断 信息 和 预测 信息 ,考虑 衰退 信息 和 资源 约束 的 集成 动态 维护 模型 是 设 
备 维护 模型 的 延伸 发 展 。 通 过 案例 分 析 , 集 成 动态 维护 模型 充分 考虑 了 设备 健康 
状态 及 衰退 信息 ,在 实用 性 和 有 效 性 方面 也 优 于 定期 维护 策略 和 纯 动 态 维护 策略 。 
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对 多 部 件 设备 来 说 ,考虑 设备 内 部 的 经 济 和 结构 相关 性 ,在 设备 使 用 中 ,有 时 
候 因 为 某 个 部 件 的 维护 会 导致 设备 的 多 个 部 件 同时 停止 运转 ,因此 ,为 了 缩短 设备 
在 生产 过 程 中 的 停机 时 间 ,减少 对 设备 维护 人 员 的 调度 次 数 ,需要 在 每 一 次 的 维护 
活动 中 对 性 能 衰退 到 一 定 程度 的 设备 尽量 进行 维护 。 同 时 ,在 设备 的 维护 过 程 中 ， 
由 于 受 企业 成 本 的 限制 ,维护 资源 不 可 能 无 限 地 满足 设备 维护 的 需求 ,也 就 是 说 ， 
受 维护 资源 的 限制 ,有 时 不 可 能 同时 进行 多 个 维护 动作 ,需要 考虑 多 个 维护 动作 的 
合理 调度 。 因 此 ,本章 以 设备 的 维护 资源 为 约束 条 件 ,以 每 次 维护 活动 的 费用 和 总 
的 维护 费用 率 为 优化 目标 ,根据 第 5 章 的 集成 动态 维护 策略 模型 ,建立 了 多 部 件 设 
备 的 维护 调度 模型 。 

对 于 设备 的 维护 调度 ,根据 第 5 章 的 设备 集成 动态 维护 模型 ,本 章 通过 故障 阔 
值 确定 部 件 所 采取 的 维护 动作 方式 , 当 部 件 故 障 率 达到 某 一 个 阔 值 时 ,就 会 相应 地 
和 触发 部 件 的 维护 活动 。 如 果 系 统 中 的 某 一 部 件 的 故障 率 达 到 了 小 修 的 阔 值 , 则 需 
要 对 部 件 进行 小 修 维护 ;如 果 某 一 部 件 的 故障 率 达 到 了 大 修 的 阔 值 , 则 需要 对 部 件 
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进行 大 修 维护 ;如 果 某 一 部 件 的 故障 率 达 到 了 更 换 国 值 , 则 需要 对 部 件 进行 更 换 维 
护 。 因 此 ,设备 可 以 同时 处 理 若 干 个 维护 动作 ,例如 ,部 件 i 的 故障 率 在 t 时 刻 达 到 
了 小 修 阔 值 ,从 而 触发 一 次 维护 活动 ,而 此 时 部 件 7 故障 率 超 过 了 更 换 阀 值 ,部 件 
故障 率 超过 了 大 修 阔 值 ,所 以 在 本 次 维护 活动 中 ,也 要 对 部 件 7 和 部 件 & 进行 相应 
的 维护 。 

设备 的 维护 调度 不 仅 考虑 了 设备 的 衰退 ,还 考虑 了 设备 部 件 间 的 经 济 相关 性 、 
结构 相关 性 和 随机 相关 性 。 由 于 在 某 一 时 刻 , 可 以 同时 采取 多 种 维护 动作 ,从 而 降 
低 了 对 设备 维护 资源 的 频繁 调度 ,减少 了 系统 的 启动 和 关闭 费用 ,缩短 了 系统 的 停 
机 时 间 , 降 低 了 设备 的 维护 费用 和 停机 费用 ,提高 了 设备 利用 率 。 因 为 维护 资源 约 
束 的 限制 ,需要 同时 确定 设备 的 维护 方式 和 调度 策略 ,保证 设备 维护 的 实施 和 最 小 
化 维护 费用 ,以 每 次 维护 活动 的 维护 成 本 和 设备 生命 周期 内 总 费用 率 为 优化 目标 ， 
建立 设备 的 维护 调度 模型 。 


6.2 设备 维护 调度 优化 模型 


6.2.1 设备 维护 调度 决策 


设备 的 性 能 衰退 是 设备 采取 维护 策略 的 基础 ,设备 性 能 衰退 的 判断 正确 性 影 
响 采 取 的 维护 动作 的 方式 ,进而 影响 设备 的 维护 效果 。 在 本 章 中 ,用 设备 的 故障 率 
Cfailure rate, FR) 来 表示 设备 的 性 能 状态 ,FR 越 大 ,代表 设备 的 衰退 状态 越 严重 ， 
设备 部 件 发 生 故 障 的 概率 增 大 。FR 可 通过 对 设备 进行 在 线 监 测 和 寿命 预测 获得 
GENIS 2 章 和 第 3 350 ,对 于 设备 的 故障 率 分 析 , 针 对 不 同类 型 的 设备 ,由 大 量 的 
故障 历史 数据 的 统计 分 析 可 知 ,一 般 设备 的 故障 率 都 呈现 “浴盆 曲线 ”的 分 布 形状 。 
针对 不 同 的 “浴盆 曲线 ”分 布 区 域 的 特点 ,已 经 有 多 种 分 布 来 表示 设备 的 故障 率 分 
布 ,如 指数 分 布 . 威 布尔 分 布 . 泊 松 分 布 、 正 态 分布 等 ,在 这 些 分 布 中 ,以 威 布尔 分 布 
最 为 典型 ,因此 ,本 章 中 的 故障 率 分 布 采用 威 布尔 分 布 来 表示 


FRO) =- 全 (全 (6-1) 
q 7 
其 中 ,8 为 形状 参数 ,7 为 尺度 参数 ,8B>0,7>>0。 
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威 布尔 分 布 的 工程 适用 范围 比较 广 , 通 过 调整 形状 参数 、 尺 度 参 数 等 , 它 可 以 
拟 合 多 种 故障 数据 。 根 据 可 靠 性 理论 ,对 威 布尔 的 故障 分 布 进行 分 析 , 在 7 保持 不 
变 的 情况 下 ,如 果 8<1 ,说 明 设备 的 故障 率 为 下 降 趋 势 ; 如 果 B 二 1, 说 明 设 备 的 故 
障 率 保持 不 变 , 为 一 个 常数 ;如 果 8>1:, 则 设备 的 故障 率 将 呈现 递增 的 趋势 。 这 说 
明 威 布尔 分 布 针 对 不 同 的 参数 取 值 ,都 可 以 精确 实现 对 设备 故障 率 曲线 的 描述 。 
因为 威 布尔 分 布 具有 以 上 这 些 优 点 ,所 以 在 本 章 中 ,采用 威 布尔 分 布 来 描述 设备 的 
故障 率 分 布 。 设 备 运转 过 程 中 的 故障 率 随 着 运行 时 间 的 增加 逐渐 升 高 ,因此 ,为 了 
延长 设备 的 使 用 时 间 和 寿命 ,要 在 出 现 故障 之 前 对 设备 采取 维护 措施 。 

为 了 减缓 设备 性 能 的 退化 ,采取 各 种 不 同 的 维护 动作 ,如 更 换 零件 .小 修 等 。 
并 且 , 对 于 不 同 的 设备 退化 状态 ,采取 不 同 的 维护 动作 ,可 以 将 设备 状态 优化 至 不 
同 的 目标 值 。 根 据 设 备 所 处 的 健康 状态 和 退化 程度 ,对 设备 采取 不 同 的 维护 动作 ， 
进而 产生 不 同 的 维护 效果 。 有 多 种 不 同 的 维护 动作 可 以 选择 ,具体 的 维护 动作 的 
集合 表示 如 下 。 

小 修 ( 用 M 表示 ) :对 设备 采取 有 限 的 维护 工作 ,也 就 是 对 设备 进行 保养 维护 ， 
仅仅 对 设备 进行 润滑 .调节 、 除 尘 等 一 系列 保养 工作 ,目的 就 是 让 设备 尽 可 能 地 保 
持 在 当前 的 健康 状态 hi;, 以 及 设备 的 衰退 程度 与 维修 之 前 相 比 有 较 小 的 改善 。 在 
本 章 中 ,用 Fw 表示 对 部 件 进行 小 修 的 故障 率 阔 值 。 

KE IRR) :对 设备 采取 较为 充分 的 维修 工作 ,对 设备 进行 修复 ,修复 部 
分 部 件 的 损耗 。 维 修 的 目的 就 是 让 设备 从 当前 健康 状态 六 恢复 到 一 个 更 好 的 健康 
状态 hj, 使 设备 的 衰退 状态 得 到 显著 改善 。 在 本 章 中 ,用 Food RIT EGRE 
的 故障 率 阔 值 。 

更 换 ( 用 尺 表 示 ): 对 设备 进行 更 换 , 直 接 用 新 的 零 部 件 更 换 发 生 故 障 或 者 损耗 
的 设备 零 部 件 , 在 这 种 情况 下 ,设备 将 恢复 到 初始 健康 状态 h ,使 衰退 的 设备 恢复 
到 全 新 状态 ,或 者 使 用 新 设备 代替 原 设备 工作 。 在 本 章 中 ,用 Fx 表示 对 部 件 进行 
更 换 的 故障 率 阔 值 。 

设备 在 经 过 维护 后 ,会 有 不 同 程度 的 恢复 ,我们 用 故障 率 的 变化 趋势 来 分 析 设 
备 的 恢复 情况 ,具体 的 维护 效果 如 图 6-1 所 示 。 图 6-1 中 的 (tw 如 ) 时 间 段 的 故障 
率 曲线 表示 小 修之 后 设备 的 维护 效果 情况 ,设备 小 修之 后 当前 设备 的 故障 率 不 发 
生变 化 ,设备 的 衰退 速度 变 缓 。(ti ,tr ) 时 间 段 的 故障 率 曲线 表示 设备 大 修 后 的 维 
护 效果 ,在 设备 大 修之 后 ,设备 的 运转 性 能 得 到 明显 的 恢复 ,设备 的 衰退 速度 也 相 
应 的 得 到 降低 。ix 之 后 的 故障 率 曲线 表示 设备 置换 后 的 维护 效果 ,在 置换 以 后 , 设 
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备 的 性 能 得 到 完全 恢复 ,设备 的 衰退 速度 也 相应 地 降低 。 
小 修之 后 的 故障 趋势 
------- 大 修之 后 的 故障 趋势 
一 :一 -一 更 换 之 后 的 故障 趋势 

















图 6-1 不 同 维护 动作 的 维修 效果 


用 不 同 的 威 布尔 参数 (8 和 刀 来 表示 每 一 部 件 采 取 的 不 同 的 维护 动作 后 的 效果 ,如 
表 6-1 所 示 。 表 中 的 i 是 设备 部 件数 量 的 标记 (例如 i 二 1, 表 示 设 备 的 第 1 个 部 件 )。 


表 6-1 对 于 不 同 部 件 的 不 同 维护 动作 的 威 布尔 参数 











维护 动作 形状 参数 8 尺度 参数 7 
小 修 Bum TM 
大 修 Bit Tia 
3B Bir Mi,R 








根据 三 种 维护 阔 值 ,我们 可 以 确定 部 件 采取 的 维护 动作 的 方式 ,设备 在 运转 过 
程 中 , 当 某 一 设备 部 件 的 故障 率 达 到 维护 阔 值 时 ,例如 达到 大 修 的 维护 阔 值 ,为 了 
降低 设备 的 维护 时 间 和 提高 系统 整体 利用 率 , 对 于 其 他 设备 部 件 , 如 果 也 达到 了 维 
护 阔 值 , 则 对 这 些 设备 部 件 也 要 采取 维护 方式 ,也 就 是 连带 维护 。 设 备 的 故障 率 随 
着 设备 性 能 的 逐渐 衰退 可 以 根据 表 5-1 中 的 威 布尔 参数 进行 确定 ,从 而 对 部 件 采 
取 相 应 的 维护 措施 。 

在 企业 的 实际 生产 过 程 中 , 随 着 设备 使 用 时 间 和 部 件 维护 次 数 的 增加 ,实际 维 
护 动作 (小 修 和 大 修 ) 的 效果 会 随 着 维护 次 数 的 增多 而 逐渐 降低 ,从 而 设备 的 衰退 
速度 增加 。 基 于 这 种 情况 ,我 们 将 在 设备 的 维护 效果 模型 中 引入 设备 加 速 衰退 因 
子 和 设备 的 性 能 恢复 因子 这 两 个 调整 因子 。 其 中 ,设备 的 加 速 衰退 因子 可 以 加 快 
设备 性 能 的 衰退 速率 ,如 果 在 设备 的 小 修 中 ,引入 设备 的 加 速 衰退 因子 , 则 随 着 设 
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备 小 修 次 数 的 增多 ,设备 的 衰退 将 明显 加 快 。 根 据 设备 的 性 能 恢复 因子 可 以 计算 
设备 采取 维护 后 的 初始 故障 率 ,引入 设备 的 性 能 恢复 因子 后 , 随 着 设备 大 修 次 数 的 
增多 ,设备 衰退 速度 不 断 增加 ,故障 率 也 恢复 得 越 来 越 少 ,如 图 6-2 所 示 。 


FR 














第 一 次 第 二 次 t 第 一 次 ”第 二 次 t 


小 修 小 修 大 修 大 修 
(a) 设备 部 件 加 速 衰退 因子 的 影响 (b) 设备 部 件 性 能 恢复 因子 的 影响 


图 6-2 调整 因子 对 设备 维护 动作 效果 的 影响 
在 引入 设备 的 加 速 衰退 因子 的 情况 下 ,设备 的 第 i 个 部 件 的 在 时 刻 1 的 小 修 故 
FRu(1) = FRu (0) + FRu (tsBim qoc X 0) (6-2) 
其 中 ,FRu(4o) 表 示 设 备 部 件 小 修之 前 的 故障 率 ,0 表示 设备 部 件 的 加 速 衰退 因子 
(0<0 二 1)。 为 了 描述 设备 部 件 的 衰退 效果 ,设备 部 件 的 加 速 衰 退 因 子 可 以 表示 
为 0 二 a ,a 是 根据 设备 部 件 的 历史 数据 来 获得 (0 二 a 二 1) ,MN 是 设备 部 件 截至 
当前 时 刻 , 所 经 历 过 的 小 修 次 数 。 从 表达 式 可 以 看 出 ,小 修 次 数 越 多 ,0 越 小 ,从 而 
设备 部 件 的 故障 率 曲线 就 会 变 陡 , 在 设备 部 件 第 一 次 小 修 时 ,MN=0。 
在 引入 设备 的 加 速 衰退 因子 和 设备 的 性 能 恢复 因子 的 情况 下 ,设备 的 第 i 个 
部 件 的 在 时 刻 : 的 大 修 故 障 率 模型 为 
FR,G) = (1— 9) FRy (to) + FR: (sR ma X 0 (6-3) 
Hop. ER (to) RIRE EK Ie Zo BB EE. o 表示 设备 部 件 的 性 能 恢复 因子 
(0 二 gp 二 1)。 为 了 描述 设备 部 件 的 性 能 恢复 ,设备 部 件 的 性 能 恢复 因子 可 以 表示 
2] e— b" .b 是 根据 设备 部 件 的 历史 数据 来 获得 (0 二 5 二 1) IN 是 设备 部 件 截 至 当 
前 时 刻 ,所 经 历 过 的 大 修 次 数 。 从 表达 式 可 以 看 出 ,大 修 次 数 越 多 ,9p 越 小 ,从 而 设 
备 部 件 维护 后 的 初始 故障 率 (1 一 p )FRi(i ) 越 大 ,设备 部 件 故障 率 恢 复 得 越 少 ,在 
设备 部 件 第 一 次 大 修 时 ,IN=0。 
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备 小 修 次 数 的 增多 ,设备 的 衰退 将 明显 加 快 。 根 据 设备 的 性 能 恢复 因子 可 以 计算 
设备 采取 维护 后 的 初始 故障 率 ,引入 设备 的 性 能 恢复 因子 后 , 随 着 设备 大 修 次 数 的 
增多 ,设备 衰退 速度 不 断 增加 ,故障 率 也 恢复 得 越 来 越 少 ,如 图 6-2 所 示 。 


FR 














第 一 次 第 二 次 t 第 一 次 ”第 二 次 t 


小 修 小 修 大 修 大 修 
(a) 设备 部 件 加 速 衰退 因子 的 影响 (b) 设备 部 件 性 能 恢复 因子 的 影响 


图 6-2 调整 因子 对 设备 维护 动作 效果 的 影响 
在 引入 设备 的 加 速 衰退 因子 的 情况 下 ,设备 的 第 i 个 部 件 的 在 时 刻 1 的 小 修 故 
FRu(1) = FRu (0) + FRu (tsBim qoc X 0) (6-2) 
其 中 ,FRu(4o) 表 示 设 备 部 件 小 修之 前 的 故障 率 ,0 表示 设备 部 件 的 加 速 衰退 因子 
(0<0 二 1)。 为 了 描述 设备 部 件 的 衰退 效果 ,设备 部 件 的 加 速 衰 退 因 子 可 以 表示 
为 0 二 a ,a 是 根据 设备 部 件 的 历史 数据 来 获得 (0 二 a 二 1) ,MN 是 设备 部 件 截至 
当前 时 刻 , 所 经 历 过 的 小 修 次 数 。 从 表达 式 可 以 看 出 ,小 修 次 数 越 多 ,0 越 小 ,从 而 
设备 部 件 的 故障 率 曲线 就 会 变 陡 , 在 设备 部 件 第 一 次 小 修 时 ,MN=0。 
在 引入 设备 的 加 速 衰退 因子 和 设备 的 性 能 恢复 因子 的 情况 下 ,设备 的 第 i 个 
部 件 的 在 时 刻 : 的 大 修 故 障 率 模型 为 
FR,G) = (1— 9) FRy (to) + FR: (sR ma X 0 (6-3) 
Hop. ER (to) RIRE EK Ie Zo BB EE. o 表示 设备 部 件 的 性 能 恢复 因子 
(0 二 gp 二 1)。 为 了 描述 设备 部 件 的 性 能 恢复 ,设备 部 件 的 性 能 恢复 因子 可 以 表示 
2] e— b" .b 是 根据 设备 部 件 的 历史 数据 来 获得 (0 二 5 二 1) IN 是 设备 部 件 截 至 当 
前 时 刻 ,所 经 历 过 的 大 修 次 数 。 从 表达 式 可 以 看 出 ,大 修 次 数 越 多 ,9p 越 小 ,从 而 设 
备 部 件 维护 后 的 初始 故障 率 (1 一 p )FRi(i ) 越 大 ,设备 部 件 故障 率 恢 复 得 越 少 ,在 
设备 部 件 第 一 次 大 修 时 ,IN=0。 
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在 本 章 的 设备 维护 调度 分 析 中 ,为 了 更 好 地 对 设备 的 维护 调度 策略 进行 研究 ， 
对 以 上 两 种 情况 都 进行 分 析 , 一 种 是 基于 方程 (6-1) 的 普通 故障 率 模型 ;一 种 是 基 
于 方程 (6-2) 和 方程 (6-3) ,引入 设备 部 件 衰退 因子 和 性 能 恢复 因子 的 故障 率 模型 ， 
并 且 与 定期 维护 调度 策略 相 比较 。 
对 于 设备 的 维护 调度 ,在 每 一 次 的 维护 活动 时 ,都 会 发 生 很 多 次 的 小 修 .大 修 
和 更 换 的 维护 动作 。 因 此 ,设备 的 总 成 本 目标 包括 设备 的 维护 成 本 Cn V d i 
障 成 本 Cr 和 设备 的 资源 成 本 C,。 同 时 ,在 考虑 设备 利用 率 的 基础 上 ,设备 的 维护 
动作 所 引起 的 停机 产生 的 停机 成 本 Cs 也 被 集成 到 设备 的 维护 成 本 模型 中 ,因此 ， 
综合 考虑 设备 成 本 和 设备 利用 率 的 一 次 维护 活动 的 成 本 模型 表示 为 
Cr = Cs C, +C, + Ca (6-4) 
在 方程 (6-4) 中 ,一 次 维护 活动 的 设备 故障 成 本 模型 可 以 表示 为 
C, = FF xl) FRG) + SSF, X FRG) (6-5) 
其 中 ,FF RAR i A MIR RAS ER GO BEAR WE i E HEP EI c 的 故障 率 。 
下 是 部 件 的 故障 依赖 成 本 ,与 维护 动作 无 关 。n 表示 部 件 的 数量 。 
一 次 维护 活动 的 设备 维护 成 本 模型 可 以 表示 为 
C, = Cus T Cra T Ch; 





= FM x (È xmas Xd E P Mu X 
i=l 


i=l i-1 i=1 


(6-6) 
Xinia 22My X Xia + Dy Mra X Xii 
i=l i=l 


HEP Cm, m Ci m Ch m BE IN BSA BE i 的 小 修 维 护 成 本 、 大 修 维护 成 本 和 置换 维护 
RE. FM 表示 部 件 的 维护 独立 成 本 ,与 维护 动作 无 关 。Xw.;,, 表 示 在 时 刻 4 对 部 
件 i 是 否 进行 小 修 , 如 果 对 部 件 i 在 时 刻 1 进行 小 修 , 则 Xm,;,, 王 1; 否则 , Xu,i,, 二 0。 
Xia RIERA e 对 部 件 i 是 否 进行 大 修 , 如 果 对 部 件 i 在 时 刻 : 进行 大 修 , 则 
Xi 一 1; 和 否则 ,Xr 一 0。XR,i 表示 在 时 刻 : 对 部 件 i 是 否 进 行 置换 ,如 果 对 部 
件 i 在 时 刻 t 进行 置换 , 则 Xe 一 1; 否 则 ,Xe 一 0。Mw Mii ,Me,; 分 别 表示 
部 件 ; 的 小 修 维护 依赖 成 本 ` 大 修 维护 依赖 成 本 和 置换 依赖 维护 成 本 。 
一 次 维护 活动 的 资源 成 本 模型 可 以 表示 为 
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C, — C4 c C4 4 Cs 


=c, X vd » (Qu... x Xwis TQ..; x Xtina TQ; x Xni 3 一 
i=1 


nuJo eX vd Y (Qui X Xuaa + Qus X Xia 
i-1 


n 


Quai Xia) Hu Jojke x vd b (oA 


i=l 


Xia + Qai X Xia + Qgui X Xg44)— Ase | J 


(6-7) 
FEP Cu Cu Ci AE Ro 8 UE C GER AS HEEL DA > MAS AAI TAMAS c 
oro Bt f ETT HEP d Ip ris BE PE AD RETI R Quis sui Qu si Qi i AT M S 


对 部 件 i 进行 小 修 、 大 修 和 置换 所 需要 的 备件 ; WCE. H RRENA HA 
备件 y 的 数量 。c, 表示 对 设备 进行 维护 缺少 维修 人 员 的 惩罚 系数 。Qw,,,;、 
Qi,w,i、Qg,r,i; 分 别 表示 对 部 件 i 进行 小 修 、 大 修 和 和 置换 所 需要 的 维修 人 员 r 的 数 
量 。 互 ,表示 在 时 刻 : 具有 的 维修 人 员 - 的 数量 。cs 表 示 对 设备 进行 维护 缺少 维 
护 工具 g WERE Qh i Qt i Qe DI AE AS AT AB Eo 进行 小 修 、 大 修 和 
置换 所 需要 的 维修 工具 g RCE, Ay RRENA: 具有 的 维修 工具 g 的 数量 。 

对 维修 人 员 和 维修 工具 来 说 ,如 果 在 某 时 刻 缺 少 这 部 分 资源 , 则 需要 等 待 ,而 
在 某 维修 时 刻 缺 少 备件 的 话 , 则 需要 进行 订货 ,因此 ,维修 人 员 和 维修 工具 的 惩罚 
系数 要 大 于 备件 的 惩罚 系数 。 在 方程 (6-8) ,HH,,, 等 于 1 一 1 时 刻 的 可 用 资源 数量 与 
t 时 刻 到 达 或 者 释放 的 资源 数量 减 去 :一 1 时 刻 所 需要 的 资源 数量 。 因 此 ,H,,, 的 
表达 式 可 以 表示 为 


Hoe = Hyer Au — 2, (Quas X Xii + QrgeX rias 
i=1 


Xp + Qe X Xia) 
JEP, :表示 在 时 刻 :一 1 具有 的 资源 q WORE. ALL RO TEM Al ¢ 到 达 或 者 
释放 的 可 用 资源 4 的 数量 。g 分 别 等 于 s,r,g。 
一 次 维护 活动 的 设备 停机 成 本 模型 可 以 表示 为 
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j=l 


ot (1 十 Ni) 一 5i T$ 上 





C= cA x Y er il atwo- 3n j (6-9) 


j=l 


N; 
Xe Tasa Eg» n) 


其 中 ,CA 表示 设备 单位 时 间 的 停机 成 本 。Tw,;、Ti,;、Tg,; 分 别 表示 部 件 i 的 小 修 
维护 时 间 、 大 修 维 护 时 间 和 和 置换 维护 时 间 。N; 表 示 设 备 的 预计 停机 数 , 即 部 件 i 停 
机 维修 时 ,所 导致 的 其 他 停机 部 件 的 数量 , 当 确 定 部 件 i 的 预计 停机 数 时 ,假设 其 
他 部 件 状 态 是 良好 的 , 且 没 有 故障 。T;" 表 示 第 i 个 部 件 和 第 j 个 部 件 同 时 维护 所 
节约 的 时 间 。 

基于 方程 (6-5) 一 方程 (6-9) ,可 以 获得 设备 一 次 维护 活动 的 总 成 本 模型 Cr 。 








Cr = FF XU) FRG.D + JF; X FRG, D) + 
i i-1 





FM X (È Xma È Xn i mE DMs X Xs + 
i i=l 
XM. X Xin + È Mes X Xo 


c, X vo([ 5 D) (Quis X Xu + Qua X Xia d Qux 


Suc mu) a) EEX ma py es E 


i=l 
Qi; X Xia T Qiii X Kerni = H,,, | +0 deg X (6-10) 
“(| b (Quz iX Xni + Qu; X Xia 
i=l 
Qui X Xnaa)— i.) J + 
Nj 
xe Tt +Ni)— Zn) + 
j=1 


n N; 
CAx >} x, Tu tN- 25 
i=1 j=l 


N; 
Kea Pe (1+Ni)— >) | 


get 
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方程 (6-10) 表 示 了 对 设备 进行 一 次 维护 活动 的 总 费用 模型 ,实际 上 ,在 设备 运 
转 的 全 生命 周期 里 会 产生 不 止 一 次 的 维护 活动 。 设 备 从 初始 的 健康 状态 开始 运 
转 , 在 运转 过 程 中 ,如 果 某 一 部 件 的 故障 率 达 到 或 者 超过 部 件 的 维护 阔 值 , 则 会 给 
该 设备 触发 一 次 维护 活动 ,设备 维护 后 ,设备 的 性 能 会 得 到 恢复 ,并 投入 使 用 ,在 后 
续 的 使 用 过 程 中 ,设备 的 故障 率 不 断 提高 ,直到 故障 率 又 达到 设备 的 维护 阔 值 , 则 
会 给 该 设备 触发 二 次 维护 ,以 此 类 推 ,直到 设备 的 全 寿命 周期 终止 。 因 此 ,在 设备 
的 每 一 次 的 维护 活动 的 费用 基础 上 ,也 要 考虑 设备 在 整个 生命 周期 内 的 多 阶段 的 
维护 调度 的 总 费用 ,设备 总 费用 率 的 方程 可 以 表示 为 

Crom = (Gur mx (6-1) 

其 中 ,Crou 表 示 设 备 维护 调度 的 总 费用 率 。Ci,r 表 示 设 备 进 行 第 次 维护 活动 所 
产生 的 总 费用 。D 表示 设备 的 全 寿命 周期 m 表示 设备 在 全 寿命 周期 内 所 执行 
的 维护 活动 的 总 次 数 。cv* 表 示 设 备 在 执行 一 次 维护 活动 时 ,所 产生 的 设备 启动 
费用 。 

基于 方程 (6-11) ,可 以 看 出 ,为 了 让 整个 设备 的 全 生命 周期 的 维护 调度 总 费用 
率 最 小 ,不 但 要 考虑 设备 在 执行 每 一 次 维护 时 所 产 的 故障 费用 、 维 护 费用 、 资 源 费 
用 和 停机 损失 ,还 要 考虑 设备 在 全 生命 周期 内 的 维护 活动 的 次 数 要 尽量 少 。 只 有 
优化 这 两 个 目标 ,设备 的 总 费用 率 才 会 降低 ,因此 ,设备 的 全 生命 周期 的 维护 调度 
总 费用 率 具 有 全 局 性 的 特点 。 


6.2.2 遗传 算法 


GA 是 模拟 生物 进化 过 程 而 进行 的 一 种 多 参数 、 多 群体 同时 优化 的 方法 ,并 行 
性 和 解 空间 的 全 局 搜索 是 其 最 大 的 特征 ,限制 性 条 件 的 约束 不 影响 其 优化 过 程 ， 
GA 的 编码 技术 简单 , 且 容 易 操 作 。 简 单 的 GA 3E E JE h XE TE (selection) , 28 XC 
(crossover) 和 变异 (mnutation) 三 种 基本 形式 构成 。 在 求解 模型 过 程 中 ,首先 把 问 
题 的 解 空间 映射 为 编码 空间 ,产生 初始 种 群 开始 其 搜索 ,模型 的 每 一 解 表示 为 一 个 
染色 体 , 染 色 体 是 由 基因 组 成 的 ,在 后 续 的 迭代 过 程 中 ,染色 体 不 断 发 生 进化 。 其 
次 ,用 模型 的 适应 度 衡量 染色 体 的 优 劣 ,并 且 , 通 过 选择 、 交 又 和 变异 的 运算 ,生成 
下 一 代 染 色 体 ,也 就 是 后 代 。 最 后 ,在 新 的 群体 中 ,凭借 模型 适应 度 的 优 劣 选 择 部 
分 后 代 ,淘汰 部 分 后 代 ,这 样 ,保持 了 种 群 的 优越 性 和 数量 的 限制 。 在 迭代 过 程 中 ， 
以 较 大 的 概率 选中 适应 度 高 的 染色 体 和 淘汰 适应 度 低 的 染色 体 , 反 复 重 复 这 个 操 
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作 , 目 标 向 着 模型 最 优 解 的 方向 不 断 地 进行 代数 进化 ,从 而 一 个 最 适应 优化 环境 的 
群体 且 满 足 求解 模型 最 优 解 收敛 条 件 被 获得 ,通过 对 模型 的 不 断 迭 代 优 化 ,最 终 所 
求解 模型 的 近似 解 或 者 模型 的 最 优 解 被 获得 。GA 在 求解 模型 中 的 优化 过 程 


如 图 6-3。 


对 问题 进行 编码 
产生 初始 种 群 


计算 种 群 中 每 个 
个 体 的 适应 度 值 

















产生 
个 





6-3 遗传 算法 的 基本 流程 


对 于 图 6-3 中 遗传 算法 的 基本 要 素 如 下 。 

(D GA 的 编码 要 素 。 是 GA 的 一 种 解 的 转换 方式 ,也 就 是 对 优化 模型 的 可 行 
解 执行 了 一 个 从 解 空间 到 搜索 空间 的 转换 。 也 就 是 说 ,编码 是 GA 的 首要 要 素 , 针 
对 不 同 的 优化 模型 ,编码 是 不 同 的 。 并 且 ,编码 要 素 影响 GA 的 其 他 要 素 。 

(2) 适应 度 函数 。 是 算法 进行 过 程 中 的 衡量 标准 ,主要 表示 了 GA 群体 中 的 
每 个 个 体 在 优化 模型 的 运算 过 程 中 发 现 模型 最 优 解 的 好 坏 标 准 ,这 一 标准 也 是 
GA 在 迭代 过 程 中 进行 自然 选择 的 重要 依据 。 不 同 的 问题 ,适应 度 函 数 的 定义 方 
式 也 有 所 不 同 。 

(3) 选择 。 使 群体 中 的 优良 个 体 可 以 以 更 大 的 概率 生存 ,防止 有 效 基 因 的 消 
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失 ,提高 算法 的 全 局 收敛 性 和 和 迭代 的 计算 效率 。 用 适应 度 值 判 断 个 体 的 优 劣 ,适应 
度 值 越 大 的 个 体 ,就 具有 越 多 的 选择 机 会 ,充分 体现 了 “优胜 劣 汰 , 适 者 生存 ”的 原 
则 , 越 优良 的 个 体 越 有 机 会 得 到 保留 ,从 而 产生 下 一 代 个 体 。 

(4) 交 又。 在 算法 迭代 过 程 中 ,有 两 个 个 体 从 群体 中 以 较 大 的 概率 被 选择 ,对 
选择 的 这 两 个 个 体 执行 交叉 操作 ,产生 了 承继 了 算法 前 代 基 本 特征 的 子 代 。GA 
的 交叉 操作 表示 对 选择 的 两 个 染色 体 ,通过 某 种 交换 方式 ,执行 染色 体 部 分 基因 的 
相互 交换 操作 ,进行 形成 了 群体 中 的 新 的 染色 体 。 交 叉 是 GA 产生 新 个 体 的 主要 
方法 ,也 是 GA 有 别 于 其 他 的 智能 进化 算法 。 

(5) 变异 。 主 要 表示 了 由 于 发 生 基因 蔡 换 操作 产生 了 GA 群体 中 的 新 的 
染色 体 。 在 蔡 换 操作 过 程 中 ,变异 要 素 具 有 随机 性 ,从 而 增加 了 算法 的 变异 操 
作 ,不 同 于 选择 和 交叉 的 丢失 信息 , 它 可 以 有 效 地 保留 信息 。GA 的 新 个 体 主 
要 是 由 交叉 操作 所 产生 ,也 影响 GA 的 全 局 最 优 解 的 进化 能 力 , 在 GA 产生 新 
个 体 的 过 程 中 ,变异 操作 是 一 种 辅助 方法 ,影响 GA 的 局 部 最 优 解 的 进化 能 
力 。 通 过 这 两 种 操作 的 相互 配合 ,使 GA 可 以 很 好 地 完成 全 局 和 局 部 最 优 解 
的 搜索 。 


6.3 案例 分 析 


在 本 章 的 案例 分 析 中 ,我 们 仍 以 液压 泵 (设备 ) 为 研究 对 象 。 液 压 泵 的 运转 是 
8 个 部 件 相互 协作 完成 的 ,因此 ,对 液压 泵 进行 维护 调度 ,就 是 对 液压 泵 的 8 个 部 
件 进行 维护 调度 。 另 外 ,该 液压 泵 在 使 用 运行 过 程 中 , 随 着 使 用 时 间 的 增加 ,液压 
泵 的 性 能 会 逐渐 衰退 ,液压 泵 的 健康 状态 会 逐渐 变 差 ,因而 ,需要 对 液压 泵 进行 相 
应 的 维护 使 其 维持 正常 的 工作 ,避免 液压 泵 失效 带 来 的 高 成 本 和 高 风险 。 并 且 , 随 
着 液压 泵 使 用 运行 成 本 和 维护 成 本 的 不 断 增 加 ,也 可 以 考虑 实施 置换 维护 。 因 此 ， 
维护 调度 以 优化 每 阶段 的 维护 调度 费用 和 总 的 费用 率 为 目标 ,制定 维护 策略 ,液压 
泵 的 8 个 部 件 的 相关 关系 如 图 6-4 所 示 。 本 算 例 应 用 遗传 算法 进行 求解 ,数据 分 
析 所 用 运行 平台 为 Matlab、VC, 运 行 环境 为 Windows XP. 
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图 6-4 设备 的 部 件 拓扑 结构 

6.3.1 数据 准备 

首先 ,对 部 件 进行 编号 ,用 1 表示 部 件 1, 以 此 类 推 。 设备 总 共有 8 个 部 件 组 
成 ,部 件 2 的 输出 分 为 两 部 分 ,分 别 输送 到 部 件 3 和 部 件 4, 然 后 经 过 汇总 ,再 输入 
到 部 件 5, 如 图 6-4 所 示 。 

在 本 节 中 ,将 维护 分 为 三 种 维护 方式 :小 修 、 大 修 和 置换 。 针 对 不 同 的 部 件 , 不 
同 的 维护 方式 的 维护 时 间 和 维护 成 本 是 不 同 的 ,如 表 6-2 和 表 6-3 所 示 。 

表 6-2 部 件 维修 动作 所 需要 的 时 间 


























部 件 编号 小 修 大 修 置换 
1 3 11 19 
2 5 13 24 
3 6 15 21 
4 5 14 26 
5 5 12 20 
6 4 16 25 
7 7 17 23 
8 5 12 23 











X 6-3 ”部 件 维护 动作 的 维护 成 本 



































部 件 编号 IME 大 修 置换 
1 6 14 26 
2 8 16 31 
3 9 18 28 
4 8 17 33 
5 8 14 27 
6 7 19 32 
7 10 20 30 
8 8 15 30 
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设备 的 故障 成 本 ,是 与 设备 的 维护 动作 种 类 不 相关 的 ,是 由 不 同 的 部 件 决定 
的 。 不 同 部 件 的 故障 成 本 如 表 6-4 所 示 。 
表 6-4 部 件 维护 动作 的 故障 成 本 


部 件 编号 1 2 3 4 5 6 8 
故障 成 本 15 18 18 19 16 19 20 17 





设备 在 维护 调度 过 程 中 ,用 威 布尔 分 布 来 描述 设备 的 故障 率 ,不 同 部 件 的 不 同 
的 维护 方式 对 应 的 威 布尔 尺度 参数 和 形状 参数 是 不 一 样 的 。 具 体 的 威 布尔 参数 取 
值 如 表 6-5 所 示 。 


表 6-5 部 件 维护 动作 的 威 布尔 参数 表 





























部 件 编号 小 修 参 数 大 修 参 数 置换 参数 

Bm VM B. Ji. 1 Bir Ti. R 
1 5. 00 4. 00 2. 30 2.95 4. 24 3. 80 
2 5. 25 4. 53 2.88 3. 12 4.21 3.98 
3 5. 50 4. 60 2.95 3. 20 4. 28 4.25 
4 4. 93 4. 12 2.40 2. 73 4. 05 3.87 
5 5. 15 3.91 2.55 2.92 4. 24 3.81 
6 4. 00 2.96 1. 89 2.01 3.10 2.75 
7 4. 50 3.51 2.16 2.42 3.50 3.21 
8 4. 85 3. 95 2.34 2.95 4.15 3. 74 




















在 本 章 分 析 的 维护 调度 中 ,主要 考虑 设备 的 三 种 维护 资源 ,分 别 是 备件 、 维 修 
人 员 和 维修 工具 。 表 6-6 列 出 了 这 三 种 资源 的 总 数量 。 表 6-7、 表 6-8 和 表 6-9 分 
别 给 出 了 每 个 设备 部 件 的 小 修 、 大 修 和 置换 所 需要 的 每 种 资源 的 数量 。 


表 6-6 设备 维护 动作 的 资源 总 量 


资源 类 别 备件 维修 人 员 维修 工具 
资源 数量 14 13 13 





X67 部 件 执行 小 修 维 护 资源 








部 件 编号 备件 维修 人 员 维修 工具 
1 1 3 3 
2 1 0 2 
3 1 3 2 
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续 表 
部 件 编号 备件 维修 人 员 维修 工具 
4 2 2 4 
5 1 4 3 
6 2 3 4 
7 2 2 3 
8 1 3 3 
表 6-8 部 件 执行 大 修 维护 资源 
部 件 编号 备件 维修 人 员 维修 工具 
1 2 6 5 
2 2 4 5 
3 2 4 3 
4 3 5 6 
5 2 5 4 
6 3 6 5 
7 3 1 4 
8 3 5 5 
表 6-9 部 件 执行 置换 维护 资源 
部 件 编号 备件 维修 人 员 维修 工具 
1 4 4 6 
2 4 5 6 
3 5 5 6 
4 5 6 7 
5 3 7 6 
6 4 6 7 
7 5 4 7 
8 6 5 6 
根据 图 6-3 ,可 以 计算 出 设备 每 个 部 件 的 预计 停机 数 ,如 表 6-10 所 示 。 
表 6-10 ”预计 停机 数 的 取 值 
N, 2 3 4 5 6 7 8 
取 值 7 6 0 0 3 2 0 


除了 上 述 的 模型 输入 参数 ,模型 中 的 其 他 输入 参数 如 表 6-11 所 示 。 
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表 6-11 其 他 参数 的 取 值 


参数 类 别 FF | M | 6 c, ra CA |- By | P Fr D 
参数 取 值 | 200 | 100 | 450 | 550 | 500 | 50 |1000| 0.3 | 0.5 | 0.7 |1400 





6.3.2 算法 设计 


首先 ,输入 模型 的 参数 值 ,包括 设 备 的 故障 率 , 设 备 的 维护 资源 数 ,预计 停 
机 数 ,每 个 设备 部 件 在 不 同 的 维护 动作 下 的 衰退 规律 ,每 个 设备 部 件 在 不 同 的 
维护 动作 下 所 需 的 各 类 维护 资源 、 维 护 费 用 、 维 护 时 间 、 设 备 总 运行 时 间 、 三 种 
维护 方式 的 维护 国 值 等 。 其 次 ,将 部 件 的 维护 记录 清空 ,维护 的 标识 设置 为 
零 。 对 于 某 一 部 件 , 其 故障 率 达 到 了 大 修 阔 值 已 ,触发 一 次 大 修 维护 活动 ,在 
这 次 的 维护 过 程 中 ,故障 率 达 到 大 修 阔 值 的 部 件 需 要 进行 大 修 维护 ,对 于 其 他 
部 件 , 如 果 故 障 率 达 到 小 修 或 者 更 换 阔 值 , 都 要 进行 相应 维护 。 同 时 ,设备 的 
维护 资源 又 限制 了 多 个 维护 动作 同时 进行 ,设备 维护 费用 也 因为 不 同 的 维护 
顺序 产生 差异 。 

在 模型 优化 求解 过 程 中 ,采用 遗传 算法 进行 调度 ,主要 步骤 为 :O 编 码 部 件 的 
维护 顺序 ,并 产生 初始 种 群 ;@ 计 算 父 代 的 个 体 适应 度 值 ,进行 选择 、 交 叉 和 变异 操 
作 , 计 算 子 代 个 体 适应 度 值 ;用 子 代 替代 父 代 ,继续 进行 遗传 操作 ,直到 达到 最 大 
进化 代数 ;@ 对 调度 结果 进行 统计 ,绘制 调度 甘 特 图 ,标记 设备 结束 一 次 维护 活动 ; 
@@ 判 断 当 前 时 间 是 否 已 到 设备 总 运行 时 间 ,如 果 没 有 到 达 , 对 设备 继续 进行 检测 是 
否 有 突 发 问题 产生 ,如 果 有 问题 产生 , 则 动态 刷新 资源 库 , 如 果 监 测 部 件 的 故障 率 
3 58 2E 7" B3 (EL ,就 产生 第 二 次 维护 活动 ,继续 采用 遗传 算法 进行 模型 的 调度 ,重复 
这 个 过 程 ,直到 设备 达到 总 的 运行 时 间 。 详 细 的 遗传 算法 维护 调度 的 计算 过 程 如 
图 6-5 所 示 。 

另外 ,对 于 遗传 算法 的 参数 设 定 为 :编码 采用 部 件 的 编号 进行 实数 编码 ,以 设 
备 维护 调度 的 总 费用 率 为 适应 度 函 数 ,进化 种 群 为 30, 最 大 遗传 代数 为 300 ,选择 
概率 为 0. 8 ,交叉 概率 为 0.8, 变 异 概率 为 0. 1。 


6.3.3 维护 调度 比较 分 析 


首先 ,分 析 不 考虑 调整 因子 的 维护 调度 模型 的 性 能 。 参 考 第 5 章 的 比较 策略 ， 
在 本 章 中 ,仍然 选择 常见 的 周期 维护 调度 作为 参考 策略 ,针对 设备 的 整个 生命 周 
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维护 调度 开始 


输入 模型 参数 数据 







维护 资源 满足 
条 件 ? 


配备 维护 资源 


制定 维护 活动 



















对 模型 进行 编码 
生成 算法 的 初始 种 群 


计算 父 代 个 体 的 适应 度 值 






































计算 父 代 每 个 个 体 的 适应 度 值 维护 结束 
图 6-5 多 部 件 设备 的 维护 调度 
期 ,将 设备 划分 为 20 个 维护 周期 (T= 二 70) ,时 间 单 位 为 天 (d)。 根 据 每 个 部 件 的 故 
障 率 , 计 算得 出 在 周期 维护 下 ,每 个 部 件 的 调度 情况 ,如 表 6-12 所 示 。 
表 6-12 周期 维护 调度 模型 的 维护 调度 
部 件 编号 M1 M2 M3 M4 M5 M6 M7 M8 M9 | MIO 
1 M M I M I 
2 I M M 
3 M M M 3 
4 M I M M 
5 M R M 
6 M M I R I 
7 M I M M 
8 M I M I 
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续 表 

部 件 编号 MI1 | M12 | M13 | M14 | M15 | M16 | M17 | M18 | M19 | M20 

1 M $ M R M 

2 I M M M I R 

3 M I M M I 

4 M I I M 

5 M I M I 

6 M I R M I 

7 R M I M R 

8 M M M I R M 
































图 6-6 所 示 的 是 4 个 部 件 的 周期 维护 调度 情况 及 这 四 个 部 件 的 故障 率 变化 情 
况 ,从 图 中 可 以 看 出 ,部 件 的 故障 率 发 展 趋势 是 不 一 样 的 ,这 是 因为 每 个 设备 部 件 
自身 的 性 能 衰退 是 不 同 的 ,以 及 采取 周期 维护 后 , 随 着 维护 次 数 的 不 同 ,设备 部 件 
的 故障 率 也 会 随 之 发 生变 化 。 





故障 概率 








M 寿命 周期 9 寿命 周期 





寿命 周期 g 寿命 周期 Š 
6-6 ”周期 维护 调度 模型 故障 概率 
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根据 方程 (6-10) 和 方程 (6-11) ,可 以 计算 获得 每 个 设备 部 件 的 维护 调度 情况 ， 
在 设备 的 整个 生命 周期 内 ,设备 总 共 进 行 了 10 次 维护 活动 ,对 于 每 个 设备 部 件 在 
这 10 次 维护 活动 进行 的 维护 调度 如 表 6-13 所 示 。 
表 6-13 ”维护 调度 模型 的 维护 调度 















































MI M2 M3 M4 M5 M6 M7 M8 M9 M10 
部 件 编号 = 
t=310 | t=409 | t=533 | t=621 | t=750 | £— 860 | t= 945 |t=1 104t=1 247 t—1 352 

1 I M M I M M I M 
2 M M I M I M M 
3 M M I M I 
4 I M M I M I M 
5 R M M M R M 
6 R R R I M 
7 M I M M R I M R 
8 I M M I M I M I 
































图 6-7 所 示 的 是 设备 中 所 有 部 件 在 整个 生命 周期 内 的 维护 情况 和 故障 率 变 化 
情况 。 从 图 6-7 中 可 以 看 出 ,在 部 件 的 运转 过 程 中 ,每 个 部 件 的 故障 率 的 发 展 趋势 
是 不 同 的 ,除了 与 部 件 自身 的 性 能 衰退 有 关 之 外 ,还 与 部 件 采 取 的 维护 策略 有 关 ， 
从 而 造成 了 每 个 设备 部 件 的 故障 率 趋 势 的 差异 ,在 本 章 提 出 的 模型 基础 上 ,对 设备 
进行 有 效 的 维护 ,可 以 保持 设备 的 故障 率 在 一 个 较 低 的 水 平 ,进而 可 以 保证 系统 在 
长 时 间 内 稳定 工作 。 

为 了 说 明 遗 传 算法 的 有 效 性 ,以 及 设备 维护 费用 的 变化 情况 ,图 6-8 显示 了 设 
备 第 二 次 维护 活动 时 ,维护 费用 的 变化 情况 , 随 着 遗传 算法 迭代 次 数 的 增多 ,设备 
的 维护 费用 逐渐 降低 ,最 后 收敛 在 一 个 稳定 的 水 平 ,得 到 整个 设备 维护 费用 的 最 优 
值 ,充分 验证 了 遗传 算法 在 调度 过 程 中 的 有 效 性 。 

针对 设备 的 10 次 维护 活动 ,我 们 对 设备 的 第 二 次 维护 活动 进行 详细 分 析 , 对 
于 第 二 次 的 设备 维护 活动 ,发 生 在 :二 409 时 刻 , 并 且 ,在 维护 活动 中 ,对 部 件 2、 部 
件 3 采 取 了 小 修 维 护 动 作 , 对 部 件 1、 部 件 4、 部 件 7、 部 件 8 采取 了 大 修 维护 动作 ， 
对 部 件 5 采取 了 置换 维护 动作 ,在 整个 维护 过 程 中 ,没有 对 部 件 6 采取 相应 的 维护 
动作 。 在 系统 的 维护 过 程 中 ,要 考虑 系统 的 维护 资源 ,在 维护 资源 缺少 时 ,无 法 对 
设备 进行 维护 ,根据 模型 的 调度 结果 , 先 对 部 件 1 .部 件 2 和 部 件 5 采取 维护 动作 ， 
根据 表 (6-8) 和 表 (6-9) ,计算 部 件 1、 部 件 2 和 部 件 5 进行 维护 所 需要 的 资源 数量 
为 [6,13,13], 从 而 ,剩余 的 资源 数量 为 [9,0,0]。 通 过 对 其 他 部 件 的 资源 需求 进行 
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图 6-7 维护 调度 模型 故障 概率 
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ARKA 
图 6-8 设备 第 二 次 维护 活动 的 费用 变化 情况 
分 析 ,部 件 3 的 资源 需求 量 为 L[1,3,2] ,部 件 4 的 资源 需求 量 为 [3,5,6] ,部件 7 的 
资源 需求 量 为 L3,1,4] ,部 件 8 的 资源 需求 量 为 L3,5,5], 因 此 ,剩余 的 资源 数量 都 
无 法 满足 剩余 部 件 的 维护 需求 量 ,部件 3 .部 件 4. 部 件 7、 部 件 8 的 维护 ,只 能 等 待 
已 经 进行 维护 的 部 件 维护 完成 后 ,获得 维护 资源 ,才能 对 部 件 进 行 维护 。 关 于 设备 
第 二 次 维护 调度 活动 的 甘 特 图 如 图 6-9 所 示 。 
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图 6-9 系统 进行 第 二 次 维护 活动 的 维护 调度 甘 特 图 
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最 后 ,根据 方程 (6-1) 、 方 程 (6-10) 和 方程 (6-11) ,可 以 获得 进行 维护 调度 的 总 
费用 率 为 89. 21, 通 过 周期 性 维护 调度 的 设备 总 费用 率 为 109. 08。 


6.3.4 考虑 调整 因子 的 维护 调度 分 析 


基于 方程 (6-2) 和 方程 (6-3) ,分 析 考 虑 设备 部 件 加 速 训 退 因子 和 性 能 恢复 因 
子 的 维护 调度 情况 ,其 中 ,小 修 的 部 件 加 速 衰 退 因 子 9 二 0.97Y ,MN 二 当前 小 修 维 
护 次 数 一 1, 大 修 的 部 件 加 速 衰退 因子 9 二 0.96 ,性 能 恢复 因子 p= 二 0.97 IN — 
当前 大 修 维护 次 数 一 1, 通 过 对 维护 调度 模型 的 分 析 , 整 个 生命 周期 内 , 共 进 行 了 
12 次 维护 活动 ,对 于 每 个 部 件 在 整个 生命 周期 内 所 进行 的 维护 次 数 如 表 6-14 
所 示 。 

从 表 6-14 中 可 以 看 出 ,除了 部 件 5、 部 件 6、 部 件 7 采 取 了 置换 维护 动作 外 , 剩 
余 的 部 件 只 采取 了 小 修 和 大 修 的 维护 ,这 些 部 件 虽然 没有 进行 置换 维护 ,但 是 经 过 
小 修 和 大 修 维护 后 ,这 些 部 件 的 性 能 也 相应 地 得 到 了 保障 ,并 且 ,对 于 部 件 5、 部 件 
6、 部 件 7, 在 进行 置换 维护 后 ,还 相应 地 降低 了 部 件 的 小 修 和 大 修 次 数 。 这 样 的 
维护 调度 策略 提高 了 设备 的 利用 率 ,并 且 ,根据 部 件 的 实际 情况 ,采取 相应 的 维 
护 活动 ,降低 了 部 件 的 故障 率 ,延长 了 设备 的 使 用 时 间 。 对 于 部 件 1、 部 件 3、 部 
件 5、 部 件 7, 在 整个 维护 调度 过 程 中 的 故障 率 的 变化 趋势 如 图 6-10 所 示 , 从 图 
中 可 以 出 ,考虑 调整 因子 的 维护 调度 策略 ,对 部 件 进 行 的 维护 次 数 明显 多 于 通过 
维护 调度 模型 所 获得 维护 策略 ,说 明了 设备 部 件 的 调整 因子 可 以 影响 设备 部 件 
的 维护 调度 。 




















表 6-14 维护 调度 模型 的 维护 调度 


























部 件 编号 小 修 数 大 修 数 置换 数 
1 7 4 0 
2 8 3 0 
3 9 2 0 
4 7 4 0 
5 5 2 1 
6 1 0 5 
7 5 4 1 
8 7 4 0 











基于 方程 (6-2) ,方程 (6-3) .方程 (6-10) 和 方程 (6-11) ,可 以 计算 考虑 部 件 调整 
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0 寿命 周期 1400 0 寿命 周期 1400 
| 部 件 5 | 




















0 寿命 周期 1400 b 寿命 周期 1400 
图 6-10 考虑 调整 因子 的 维护 调度 模型 故障 概率 
因子 的 维护 调度 策略 的 总 费用 率 为 97. 79. 

对 于 以 上 3 种 维护 调度 模型 的 分 析 , 如 表 6-15 所 示 。 通 过 表 6-15 可 以 看 出 ， 
虽然 定期 维护 调度 策略 通过 采取 不 同 的 维护 动作 提高 了 设备 的 利用 率 , 但 是 ,在 设 
备 维护 调度 过 程 中 ,采取 的 维护 活动 次 数 较 多 ,造成 了 设备 停机 时 间 过 长 ,进而 损 
耗 了 高 昂 的 设备 维护 成 本 。 设 备 的 维护 调度 策略 不 仅仅 降低 了 设备 维护 调度 的 总 
费用 率 ,还 提高 了 设备 的 利用 率 , 并 且 .维护 活动 次 数 较 少 ,从 而 降低 了 设备 的 停机 
时 间 。 因 此 ,在 设备 的 总 费用 率 、 维 护 活动 次 数 和 设备 利用 率 方面 ,维护 调度 策略 
都 明显 优 于 周期 维护 调度 策略 。 对 于 考虑 设备 调整 因子 的 维护 调度 模型 ,与 周期 
维护 调度 策略 相 比 ,考虑 设备 调整 因子 的 维护 调度 策略 具有 低 的 总 费用 率 , 少 的 维 
护 活动 次 数 和 高 的 利用 率 , 所 以 说 性 能 方面 , 优 于 周期 维护 调度 策略 。 与 维护 调度 
策略 相 比 ,虽然 考虑 设备 调整 因子 的 维护 调度 策略 的 总 费用 率 和 维护 活动 的 次 数 
都 高 于 维护 调度 策略 ,但 是 ,提高 了 设备 的 利用 率 , 并 且 考 虑 设备 调整 因子 的 维护 
调度 策略 更 加 符合 设备 的 实际 运转 情况 。 也 就 是 说 , 随 着 维护 次 数 的 增多 ,维护 后 
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的 效果 也 会 相应 地 降低 。 
表 6-15 不 同 维护 调度 优化 策略 的 结果 比较 
"PT 2 考虑 调整 因子 的 周期 维护 
评估 标准 维护 调度 模型 维护 调度 模型 调度 策略 
总 费用 率 89. 21 97. 79 109. 08 
维护 活动 次 数 10 12 20 
设备 利用 率 93.18% 97.92% 87.67% 











6.4 Jk RR) Bi 


基于 第 5 章 提出 的 集成 动态 维护 模型 ,考虑 液压 泵 这 一 类 设备 的 多 部 件 特征 ， 
本 章 介 绍 了 多 部 件 设备 的 维护 调度 优化 策略 ,考虑 了 设备 的 性 能 衰退 .设备 部 件 的 
结构 相关 性 .设备 部 件 间 的 相关 关系 和 设备 维护 资源 的 约束 ,建立 了 设备 维护 调度 
模型 和 考虑 设备 调整 因子 的 维护 调度 模型 。 并 且 ,将 模型 应 用 到 液压 泵 系统 中 ,以 
周期 性 维护 调度 策略 为 参照 策略 ,通过 对 模型 的 比较 分 析 ,维护 调度 模型 在 维护 调 
度 的 总 费用 率 、 维 护 活动 次 数 和 设备 的 利用 率 等 方面 都 优 于 周期 性 维护 调度 模型 ， 
并 且 , 随 着 对 设备 维护 次 数 的 增多 ,维护 效果 会 逐渐 降低 ,考虑 调整 因子 的 维护 调 
度 模型 ,更 加 符合 设备 的 实际 情况 。 
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7.1 结 论 


设备 是 现代 企业 制造 产品 的 重要 物质 资源 与 保障 ,是 企业 生存 和 发 展 的 基础 。 
设备 管理 的 水 平 直 接 影响 企业 的 生产 能 力 、 产 品质 量 、 生 产 成 本 、 劳 动 生产 率 和 能 
源 消耗 等 。 设 备 管理 逐渐 成 为 企业 生产 管理 的 一 个 重要 组 成 部 分 。 现 代 科学 生产 
技术 的 发 展 不 仅 增加 了 设备 的 机 械 复杂 度 ,而 且 提 高 了 生产 系统 的 复杂 性 。 为 了 
解决 使 用 先进 复杂 设备 所 带 来 的 一 系列 技术 ,经济 管理 上 的 新 问题 ,解决 传统 设 
备 管理 的 缺陷 与 局 限 性 ,世界 上 的 工业 发 达 国 家 逐渐 提出 并 发 展 了 许多 新 型 的 设 
备 维护 理论 和 相关 支持 技术 。 

CBM 是 从 众多 维护 理论 中 脱颖而出 并 引起 了 众多 学 者 关注 的 维护 方法 ,维护 
策略 的 制定 建立 在 设备 当前 健康 状态 和 未 来 健康 状态 趋势 分 析 的 基础 上 ,以 满足 
设备 可 靠 性 要 求 并 以 兼顾 维护 成 本 最 低 为 目的 。 目 前 ,由 于 工业 界 对 预防 性 维护 
技术 的 需求 ,故障 诊断 领域 的 研究 重点 已 逐步 转向 状态 监测 .预测 性 维修 和 故障 早 
期 诊断 领域 。 准 确 并 可 靠 的 预测 分 析 结果 是 成 功 执行 基于 状态 的 工程 系统 维护 的 
关键 因素 ,并 且 对 安全 性 能 的 改进 、 任 务 的 规划 、 维 修 时间 表 的 制定 、 维 修成 本 的 降 
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低 和 停工 时 间 的 减少 等 都 起 着 至 关 重 要 的 作用 。 本 书 主 要 研究 基于 状态 的 设备 维 
护 相 关 技术 和 优化 模型 。 在 分 析 国 际 上 设备 健康 状态 预测 技术 的 发 展 并 结合 目前 
设备 维护 的 实际 情况 的 基础 上 ,本 书 以 单 设备 系统 为 研究 对 象 ,通过 对 基于 状态 的 
设备 维护 优化 的 研究 ,完成 以 下 研究 内 容 。 

1. 针对 离线 健康 预测 问题 ,建立 单 监测 信息 的 在 线 健康 预测 模型 

为 了 进行 设备 的 在 线 健康 预测 ,基于 HSMM 和 SMC 的 联合 优化 ,建立 了 一 
套 完 整 的 HSMM 和 SMC 的 联合 优化 在 线 健 康 预测 模型 。 提 出 了 一 种 联合 多 步 
向 前 健康 识别 算法 ,用 于 在 线 识别 设备 健康 状态 ,并 且 , 将 在 线 识别 的 健康 状态 用 
作 健 康 预测 的 分 析 基 础 和 依据 ,提出 了 在 线 剩余 寿命 预测 模型 。 当 前 ,单一 的 方 
法 模型 .算法 很 难 满足 设备 的 在 线 健康 预测 ,本 书 提出 的 联合 模型 ,是 基于 
HSMM 丰富 的 数学 结构 和 SMC 的 在 线 特征 而 来 的 ,利用 设备 的 健康 预测 对 其 性 
能 状态 进行 量化 ,进而 描述 设备 的 实际 运行 状况 。 

为 了 说 明 方 法 的 有 效 性 ,对 提出 的 在 线 健康 预测 方法 进行 验证 ,验证 结果 显示 
提出 的 方法 很 好 地 描述 了 设备 的 健康 变化 情况 。 并 且 与 一 步 向 前 识别 算法 、 多 步 
向 前 识别 算法 和 HSMM 进行 了 比较 分 析 , 验 证 了 该 方法 在 单 监测 信息 在 线 健康 
预测 方面 的 有 效 性 和 准确 性 ,也 为 后 续 内 容 的 发 展 ,提供 了 分 析 依 据 和 基础 。 

2. 针对 单 监测 信息 健康 预测 方法 ,建立 多 监测 信息 的 在 线 健康 预测 模型 

为 了 更 好 地 提高 在 线 健康 预测 的 精确 度 , 基 于 单 监测 信息 在 线 健康 预测 方法 
的 思想 ,提出 了 多 监测 信息 的 在 线 健康 预测 方法 。 为 了 处 理 多 监测 信息 和 降低 模 
型 的 计算 复杂 性 ,对 HSMM 的 基本 算法 进行 了 修正 ,提出 了 修正 的 前 向 一 后 向 算 
法 、Viterbi 算法 和 Baum-Welch 算法 ,计算 复杂 性 从 O(CMD+M2)T) 降 低 到 
O(CD+M2)T)。 建 立 了 自 适应 隐 式 半 马 尔 可 夫 模型 ,来 处 理 多 监测 信息 的 在 线 
健康 预测 问题 ,应 用 最 大 似 然 线性 回归 训练 对 输出 概率 分 布 和 驻 留 概率 分 布 进行 
自 适应 训练 ,处 理 多 监测 信息 之 间 的 差异 性 。 结 合 修正 的 HSMM ,进行 有 效 的 多 
监测 信息 在 线 健康 预测 。 在 此 基础 上 .提出 多 监测 信息 的 在 线 剩余 寿命 预测 方法 。 

为 了 说 明 方 法 的 有 效 性 ,对 提出 的 多 监测 信息 在 线 健 康 预测 方法 进行 验证 , 根 
据 验 证 分 析 可 知 , 多 监测 信息 的 在 线 健康 预测 与 单 监 测 信 息 在 线 健康 预测 相 比 ,在 
设备 健康 状态 识别 .诊断 .预测 和 计算 复杂 性 方面 ,具有 更 好 的 有 效 性 和 准确 性 ,也 
为 后 续 维 护 的 发 展 , 提 供 了 基础 。 

3. 针对 传统 的 维护 方式 ,建立 基于 在 线 健康 预测 的 集成 动态 维护 模型 

首先 ,针对 传统 的 设备 维护 模型 ,集成 维护 考虑 了 设备 的 衰退 性 能 (设备 的 退 
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化 和 老化 信息 ) ,结合 了 设备 的 诊断 信息 和 预测 信息 ,以 总 的 维护 成 本 (故障 成 本 、 
维护 成 本 和 资源 成 本 ) 和 总 维护 时 间 为 目标 ,提出 了 基于 在 线 健康 预测 的 集成 动态 
维护 模型 ,建立 了 两 层 集成 动态 维护 模型 ,实行 分 阶段 的 动态 维护 。 

其 次 ,在 传统 的 维护 模型 中 ,设备 的 维护 资源 只 考虑 了 备件 的 约束 条 件 , 本 书 
中 ,同时 考虑 了 备件 和 维修 人 员 的 双 约 束 条 件 。 并且, 针对 小 修 和 大 修 的 维护 方 
式 , 引 入 了 维护 风险 影响 ,将 维护 风险 因子 集成 到 动态 维护 模型 。 

最 后 ,对 模型 进行 验证 ,根据 验证 分 析 可 知 , 提 出 的 集成 动态 维护 模型 ,与 定期 
维护 模型 和 纯 动态 维护 策略 相 比 ,具有 更 好 的 有 效 性 和 准确 性 ,也 为 后 续 多 部 件 设 
备 维护 的 拓展 ,提供 了 基础 。 

4. 针对 系统 的 维护 策略 ,建立 基于 集成 维护 模型 的 维护 调度 优化 模型 

基于 集成 动态 维护 模型 ,针对 多 部 件 设备 的 特点 ,建立 多 部 件 设备 的 维护 拓展 
模型 。 多 部 件 设 备 的 维护 决策 包括 性 能 衰退 、 维 护 方式 和 维护 费用 三 部 分 。 在 性 
能 衰退 方面 ,通过 在 线 诊断 信息 和 预测 信息 得 到 设备 故障 率 变化 趋势 ,用 威 布尔 分 
布 模拟 设备 的 衰退 过 程 ;在 维护 方式 方面 ,定义 小 修 、 大 修 和 更 换 三 种 维护 方式 ,分 
别 描述 了 三 种 维护 方式 对 设备 故障 率 的 影响 ;在 维护 费用 方面 ,考虑 了 故障 成 本 、 
维护 成 本 ,资源 成 本 和 停机 成 本 四 部 分 ,根据 每 次 维护 活动 的 费用 模型 ,建立 了 多 
阶段 的 总 费用 率 模 型 。 

为 了 说 明 维 护 拓展 模型 的 有 效 性 ,对 提出 的 维护 调度 优化 模型 进行 验证 ,根据 
验证 分 析 可 知 , 提 出 的 多 部 件 设备 维护 调度 优化 模型 ,与 周期 性 维护 调度 优化 模型 
相 比 ,在 总 费用 率 、 生 命 周期 维护 活动 次 数 和 设备 利用 率 方面 ,具有 很 好 的 性 能 和 
有 效 性 。 


7.2 展 望 


本 研究 开展 设备 健康 预测 .设备 维护 优化 研究 ,提出 和 拓展 了 一 些 设备 健康 预 
测 方法 、 设 备 维护 策略 方法 ,是 设备 维护 领域 内 的 前 沿 或 热点 问题 , 既 具 有 较 高 的 
研究 价值 ,也 具有 很 好 的 扩展 性 ,可 从 以 下 几 方 面 进一步 深入 研究 。 

COD 本 研究 讨论 的 在 线 健康 预测 模型 , 随 着 在 线 监测 数据 的 增多 ,需要 改进 目 
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前 的 在 线 健康 预测 方法 ,将 其 优化 到 适应 大 数据 的 健康 预测 领域 。 

(2) 本 研究 中 多 监测 信息 的 AHSMM 是 基于 设备 工作 负荷 稳定 的 基础 上 的 ， 
将 设备 的 失效 率 结合 到 设备 的 健康 预测 模型 。 对 于 进一步 的 工作 ,部 分 失效 率 的 
模型 可 以 被 考虑 结合 到 健康 预测 模型 中 ,考虑 设备 的 变动 工作 负荷 及 条 件 。 

(3) 本 研究 提出 的 基于 设备 性 能 衰退 和 维护 风险 的 集成 动态 维护 模型 体现 了 
良好 的 性 能 ,针对 将 来 更 复杂 的 制造 设备 ,可 以 考虑 对 维护 模型 进一步 精确 和 优 
化 。 针 对 目前 的 维护 资源 只 考虑 了 备件 和 维修 人 员 , 可 以 将 维护 资源 约束 进一步 
进行 扩展 ,包括 设备 的 维护 工具 和 维护 能 源 等 。 

(4) 本 研究 建立 了 多 部 件 设备 的 维护 调度 优化 模型 ,并 且 具 有 很 好 的 性 能 ,但 
是 ,针对 多 部 件 设备 与 生产 之 间 的 关系 ,还 需要 进一步 的 丰富 。 另 外 ,这 类 问题 属 
于 NP 问 题 ,求解 模型 需要 借助 启发 式 算法 的 优化 ,因此 ,在 求解 模型 的 算法 上 可 
以 做 进一步 的 研究 。 
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